Note sull'episodio
本期内容要点
- DeepSeek视觉论文连夜撤稿:4月30日,DeepSeek发布多模态论文《Thinking with Visual Primitives》,核心思路是让模型在推理过程中直接用点和框标记物体,解决多模态模型“看得清但指不准”的引用鸿沟。在756×756像素图片上,DeepSeek仅用81个token处理单元,而GPT-5.4需740个、Claude需870个。论文发布几小时后即撤下,推文和GitHub仓库均被删除,业内猜测是“透露了太多技术细节”。
- 蚂蚁集团开源万亿参数模型Ling-2.6-1T:主打“快思考”机制,采用MLA与LinearAttention混合架构,输出成本约为同类模型的四分之一。在代码生成、缺陷修复等领域达开源SOTA水平,综合智能对标GPT-5.4的非推理模式。已在蚂蚁内部自主完成反馈分类、日志分析、代码修复等任务。
- 小红书成立AI一级部门Dots:4月30日全员内部信宣布组织大调整,Dots与原有部门平级,直接向新任总裁柯南汇报,建设从模型研发到产品的完整技术体系。同时成立企业智能部,推动AI融入社区、电商、商业化三大业务,标志着小红书正式全面入局大模型赛道。
- 阿里发布数字员工QoderWake:可承担软件工程师、运营、分析师等真实岗位角色,采用Harness-First设计。内部已上线“数字程序员”,单问题根因分析时间从约30分钟压缩到2分钟。上线8个月用户超500万,ARR突破6000万美元。
- Chrome正式发布Prompt API:开发者可通过JavaScript代码直接调用浏览器内置的Gemini Nano模型,实现本地AI推理。无需API密钥、无服务器 ...
Parole chiave
AI商业信息