当地时间4月10日,美国开放人工智能研究中心(OpenAI)宣布开源包含1266个挑战性问题的基准测试BrowseComp。OpenAI表示,一个高性能的浏览智能体应该能够定位那些难以查找、可能需要在浏览数十甚至数百个网站的过程中才能获取的信息。现有基准测试(如SimpleQA)主要衡量模型检索基本孤立事实的能力,这类测试已被具备快速浏览工具(如支持浏览功能的GPT-4o)的模型所饱和。为了衡量AI智能体在互联网上定位难以查找、相互关联信息的能力,现开源基准测试BrowseComp。
相关文章
-
场均15分3板,命中率58%,22岁小将化身奇兵,成各队哄抢对象
在 NBA 总决赛的舞台上,聚光灯往往聚焦于那些星光熠熠的超级巨星,他们凭借着卓越的个人能力和丰富的大赛经验,引领着球队向总冠军发起冲击。然而,篮球是一项团队运动,在这激烈的角逐中,总有一些看似不起眼的角色球员,如同一颗颗隐藏的 “炸弹”,在关键时刻引爆全场,改变比赛的走势。今年的总决赛,步行者队的
2025-06-14 11:14:00
-
要是AI不赚钱,云厂商就亏麻了
文|数据猿过去一年,云厂商们似乎达成了某种共识:只要AI是趋势,就应该“重投算力”。于是我们看到,AWS、微软云、谷歌云,以及腾讯、阿里、华为、百度、字节纷纷宣布加码AI基础设施建设,开设智算中心、采购上万张GPU、投入百亿级资金用于新一代AI集群建设。媒体称之为“新基建”,资本市场称之为“下一个增
2025-06-13 15:37:00
-
今年“港股AGI第一股”确认了!云知声冲刺IPO五年终通过港交所聆讯
6月13日消息,笔者从港交所官网获悉,云知声智能科技股份有限公司(以下简称“云知声”)已通过港交所聆讯并于6月12日晚披露通过聆讯后的资料集,中金公司和海通国际担任联席保荐人。在此之前,云知声已经完成证监会境外发行上市及境内未上市股份“全流通”备案通知书。这意味着,云知声即将成为今年“港股AGI第一
2025-06-13 08:15:00
-
字节火山引擎否认与老凤祥合作打造AI智能眼镜
近日,据新浪科技报道,多款由老凤祥与字节旗下火山引擎合作的AI眼镜,即将将于七月正式发布。这一消息被业界视为字节携手老凤祥入局AI眼镜。6月12日,火山引擎相关负责人表示:火山引擎没有与老凤祥合作打造AI智能眼镜的计划。豆包大模型为公开售卖产品,任何客户都可以合规采购。实际上,就在6月11日的国际养
2025-06-12 17:12:00
-
长春汽开区:聚光“汽”势 智启新程
6月10日,2025长春国际光电博览会·Light国际会议(以下简称长春光博会)盛大开幕。作为中国汽车工业重镇的长春汽车经济技术开发区(以下简称长春汽开区),以“汽车电子产业高质量发展”为主线,通过“展台展示+论坛研讨+现场洽谈”三位一体模式,全方位呈现汽车产业与光电科技深度融合的创新成果。作为长春
2025-06-12 14:44:00
-
第四代建筑遇上DEPAIR LIFE,共同打造健康人居新标准
当垂直森林在都市钢筋水泥中生长,当建筑阳台变成空中花园,第四代建筑正以“生态融合”之名重塑城市天际线。然而,在绿意盎然的表象之下,内部却潜伏着空气污染的严重威胁。世界卫生组织《室内空气质量指南》指出:在通风不足的密闭环境中,室内甲醛等污染物的浓度可达室外的100倍,长期暴露将严重危害呼吸系统及免疫机
2025-06-12 11:56:00