推出HealthBench
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能和安全提供一个共享标准。
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能和安全提供一个共享标准。
DeepSeek-V3团队(首席执行官梁文峰为共同作者)发布了一篇14页的技术论文,阐述了“AI架构的扩展挑战…
在我们的年度开发者大会上,我们宣布了如何通过 Gemini 使 AI 更加有用。 原文链接: https://…
我们即将推出星门阿联酋——这是OpenAI人工智能基础设施平台星门的首次国际部署。 原文链接: https:/…
新型AI智能体通过结合大型语言模型的创造力和自动化评估器,进化出用于数学和计算机实际应用的算法 原文链接: h…
距离TechCrunch Disrupt 2025门票高达900美元的优惠活动仅剩48小时——第二张门票可享9…
大型语言模型领域的重要参与者DeepSeek AI最近发表了一篇研究论文,详细介绍了一种旨在增强通用奖励模型 …