推出HealthBench
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能和安全提供一个共享标准。
HealthBench 是一个用于评估医疗保健领域 AI 的新型评估基准,它在现实场景中评估模型。它在 250 多位医生的参与下构建,旨在为医疗保健中的模型性能和安全提供一个共享标准。
Transformer 对自然语言处理 (NLP) 和计算机视觉 (CV) 的变革性影响是不可否认的。它们的扩…
新型AI智能体通过结合大型语言模型的创造力和自动化评估器,进化出用于数学和计算机实际应用的算法 原文链接: h…
OpenAI正在更新为Operator提供动力的AI模型,Operator是一款能够自主浏览网页并在云托管虚拟…
OpenAI刚刚完成了其迄今为止最大的一笔收购,以65亿美元全股票交易收购了Jony Ive和Sam Altm…
Gemma 3n是一款尖端的开放模型,专为设备上的快速多模态AI而设计,具有优化的性能、独特的2合1模型带来的…
Gemini 2.5 Pro 继续受到开发者的喜爱,被认为是最佳的编码模型,而 2.5 Flash 也随着新的…