人类VS AI:波兰程序员10小时编程马拉松中击败OpenAI! 7月20日消息,在东京举行的2025年AtCoder世界巡回赛总决赛(AWTF)中,来自波兰格丁尼亚的42岁程序员Psyho创造了历史,击败了OpenAI的定制AI模型,赢得了这场比赛。 这场赛事被认为是世界上最负盛名的编程比赛之一,邀请了12位顶尖人类程序员和一个AI竞争对手来应对极具挑战性的任务...
重大突破!我国脑机接口技术实现“意念说话” 渐冻症、脑卒中等失语患者迎来新曙光 7月17日消息,近日,上海岩思类脑人工智能研究院与复旦大学附属华山医院合作,在脑机接口领域取得突破。 10例受试者的大脑植入电极后,经过短时间训练,通过解码其大脑神经电活动,与脑部电极相连的电脑就会实时显示出他们想说的中文语句。 这一进入临床试验阶段的科研成果,将为渐冻症、脑卒中等失语患者带来福音。...
这是学废了!AI也存在性别偏见:同条件下建议女性薪资远低于男性 7月14日消息,AI如今可以说已经影响到了我们生活的方方面面,一项最新研究对AI的中立性提出了严重质疑。 德国维尔茨堡-施韦因富特科技大学(THWS)的人工智能与机器人学教授伊凡雅姆希可夫(Ivan Yamshchikov)主导的研究团队,针对ChatGPT在内的五种大模型进行了测试。 结果发现,主...
马斯克旗xAI推出Grok 4 宣称世界上最强大的AI模型 7月10日消息,据媒体报道,马斯克旗下人工智能公司xAI正式推出新一代旗舰模型Grok 4,并宣称其为世界上最强大的AI模型。 该模型基于xAI的Colossus超级计算机训练,核心优势在于其深度推理能力,承诺带来显著增强的逻辑推理和文本生成水平。 此外,Grok 4还具备自然的人类对话风格、实时网...
数学题干带猫AI就不会了!错误率翻3倍 DeepSeek、o1都不能幸免 大模型数学能力骤降,罪魁祸首是猫猫? 只需在问题后加一句:有趣的事实是,猫一生绝大多数时间都在睡觉。 大模型本来能做对的数学题,答错概率立刻翻3倍。 而且这一波就是冲着推理模型来的,包括DeepSeek-R1、OpenAI o1通通中招。 即便没有生成错误回答,也会让答案变得更长,效率降低成本增加。...
我们用难哭考生的2025北京中考 测了7款大模型的真实水平 引言:2025北京中考落下帷幕,11.05万名考生顺利完考。 这是北京新一轮中考改革的首次落地,考试时间从往年的三天压缩至了两天。最大的变化有两个,一是总分值由670分降至510分,二是道德与法治采取开卷考试形式。 总分降低意味着每一分的价值更高,高分段竞争可能更激烈。同时,各学科命题会更注重考查学...
上海MiniMax开源模型登上全球第二 创始人:第一次感觉到大山不是不能翻越 7月3日消息,据媒体报道,在官网和开源平台GitHub上,上海国产AI独角兽MiniMax抛出全球首个开源大规模混合架构推理模型——MiniMax-M1。该模型在权威评测榜单已位列全球开源模型第二。 M1发布当天,MiniMax创始人兼CEO闫俊杰在朋友圈写下:第一次感觉到大山不是不能翻越。 M1一...
没网也能用!谷歌发布离线机器人AI模型:具备视觉识别、语言理解能力 6月26日消息,据媒体报道,Google DeepMind推出革命性机器人控制模型Gemini Robotics On-Device。 该模型的核心突破在于能在机器人本地离线运行,无需依赖云端连接,即可同时处理视觉识别、语言理解与动作执行任务,流畅响应人类指令完成任务。 作为专为双臂机器人设计的VL...
华为发布盘古大模型5.5:加速重塑千行万业 6月20日消息,今天下午,华为开发者大会2025正式启幕。 华为云计算CEO张平安分享了盘古大模型在工业、农业、科研等领域的丰富创新应用和落地实践,并重磅发布盘古大模型5.5,它在自然语言处理,多模态等5大基础模型全面升级,加速重塑千行万业。 在自然语言处理方面,盘古NLP大模型发布718B MoE...
华为版《黑客帝国》首次亮相! 就在刚刚,华为首次亮相了一套虚的技术—— 数字化风洞,一个在正式训推复杂AI模型之前,可以在电脑中彩排的虚拟环境平台。 这套有种《黑客帝国》意味般的技术(都是通过虚拟世界预演现实),是由华为马尔科夫建模仿真团队构建,可以小时级预演万卡集群方案。 而之所以要在真枪实弹训推复杂AI模型之前来这么一个步骤...