推出HealthBench
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能和安全提供一个共享标准。
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能和安全提供一个共享标准。
DeepSeek AI宣布发布DeepSeek-Prover-V2,这是一个突破性的开源大型语言模型,专门为L…
我们更新的 Gemini 2.5 Pro 预览版改进了编码功能。 原文链接: https://deepmind…
我们看到开发者们用Gemini 2.5 Pro创造了令人惊叹的成果,因此我们决定提前几周发布更新版本,以便开发…
了解我们在 I/O 大会上发布的全新 SynthID 检测器门户网站,帮助人们了解其在线看到的內容是如何生成的…
OpenAI正在更新为Operator提供动力的AI模型,Operator是一款能够自主浏览网页并在云托管虚拟…