推出HealthBench
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能和安全提供一个共享标准。
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能和安全提供一个共享标准。
近期诺贝尔奖表彰了蛋白质发现领域的突破性进展,突显了基础模型 (FM) 在探索巨大组合空间中的变革潜力。这些模…
OpenAI的o1系列和DeepSeek-R1的显著成功,已无可辩驳地证明了大规模强化学习(RL)在引出复杂的…
谷歌研究的“绿色通行计划”旨在利用人工智能降低交通排放,现已扩展到波士顿的114个路口。这项技术利用人工智能和…
Mistral AI,这家法国公司开发了AI助手Le Chat和多个基础模型,正式被认为是法国最有前景的科技初…
Gemma 3n是一款尖端的开放模型,专为设备上的快速多模态AI而设计,具有优化的性能、独特的2合1模型带来的…
从 Imagen 4 和 Veo 3 到 Flow,今天就试试这些新的生成式媒体工具吧。 原文链接: http…