全部
模型
产品
行业动态
论文研究
技巧与观点
模型发布/更新
Mistral AI:News(网页) · 21 小时前
Mistral AI 今日发布 Leanstral 1.5,一款 Apache-2.0 许可的开源形式化验证模型,119B 总参数仅 6B 活跃。在 miniF2F 上达 100% 饱和,PutnamBench 解决 587/672 题,FATE-H(87%)和 FATE-X(34%)创 SOTA。训练经历 mid-training、SFT 和基于 CISPO 的强化学习。具备智能体式证明能力,在 57 个开源仓库中发现 5 个未知 bug。模型已通过 HuggingFace 和免费 API 开放使用。
公众号:生数科技(Vidu·视频) · 1 天前
7月3日,生数科技在2026全球数字经济大会上发布Vidu S1实时交互模型,支持实时视频通话和语音控制视频走向,实现无限时长连续互动。模型采用自回归扩散路线,基于已生成画面和语音指令持续预测后续内容;无需传统建模,一张图片即可创建角色并自定义音色。Vidu S1在540P分辨率下实现25FPS(最高42FPS)实时生成,通过TurboDiffusion等技术降低计算成本,已开启内测。
产品发布/更新
公众号:京东JoyAI · 1 天前
JoyAI App 近日上线 UGC 数字人功能,用户只需上传一张照片即可生成专属虚拟数字分身,支持一键复刻写实形象或通过模板重塑为卡通风格,搭配用户自己的语音即可解锁专属陪伴。该功能复用"万能博士"技术底座,集成 JoyAI 语言、语音、数字人大模型,实现行业领先的全双工对话,支持随时打断、自然接话。数字人兼具情绪陪伴与全能助手属性,可提供点外卖、金融咨询、学英语、规划行程等生活服务。
Hacker News 热门(buzzing.cc 中文翻译) · 1 天前
Safari Technology Preview 247 推出 Safari MCP 服务器,基于 Model Context Protocol,允许任何 MCP 兼容客户端连接 Safari 浏览器窗口。智能体可获取 DOM、网络请求、截图、控制台输出等信息,自主完成调试、性能分析、可访问性检查等任务。内置 `browser_console_messages`、`screenshot`、`evaluate_javascript`、`list_network_requests` 等工具。开发者安装后启用"远程自动化与外部智能体"选项,即可通过命令接入,减少窗口切换。
公众号:面壁智能(MiniCPM) · 1 天前
面壁智能发布全球首个完全由AI编写、无人类干预的生产级大模型预训练框架ForgeTrain。该框架针对特定模型和硬件从零自动"锻造"专用训练代码。基准测试显示,ForgeTrain在8小时内追平Megatron-LM,1.5至2天内实现稳定反超,模型FLOPS利用率提升约8%~10%,且可迁移至不同模型(MiniCPM4-0.5B/8B)和硬件(H100及昇腾NPU)。其采用四阶段Harness优化流程,全程自动判定。面壁智能将其工程思想概括为Forge Engineering。
X:阿里云 / Alibaba Cloud (@alibaba_cloud) · 1 天前
Wan Video 新功能:**音乐伴舞** 💃
上传一个角色,添加一首歌曲,让 Wan Video 生成与节奏同步的舞蹈视频。
可用舞种:
• 街舞
• 踢踏舞
• 拉丁舞
• K-Pop
• 中国古典舞
从节拍至动作,你的角色随音乐起舞。
前往 wan.video 体验音乐伴舞 👉 https://int.alibabacloud.com/m/1000412428/
行业动态
IT之家(RSS) · 1 天前
安全厂商 Sysdig 首次记录到 AI Agent"JADEPUFFER"自动完成的勒索攻击。攻击利用暴露的 Langflow 服务漏洞 CVE-2025-3248 远程执行 Python 代码,随后自主收集 OpenAI、Anthropic、DeepSeek、Gemini 等 API 密钥及阿里云、腾讯云、华为云、AWS、Google Cloud、Azure 等云平台凭证,通过 MinIO 默认密码访问对象存储并创建每 30 分钟连接的计划任务。横向移动到 MySQL 和 Nacos 服务器,利用数据库 Root 账号及 Nacos 漏洞 CVE-2021-29441 获取管理权限,加密全部 1342 条配置数据,留下包含比特币钱包地址和 Proton Mail 的勒索信息。AI 在首次操作失败后 31 秒内自主完成错误分析与修复,累计执行超过 600 个攻击载荷,全程无需人类操作。
IT之家(RSS) · 1 天前
7月3日,国家互联网信息办公室就《互联网信息服务管理办法(修订草案征求意见稿)》再次公开征求意见。草案新增"智能信息服务"专章,要求AI服务提供者公示技术基本原理、训练数据来源,对生成合成内容进行标识,禁止强制用户使用智能服务或利用算法扰乱网络舆论。草案还强化用户账号管理,明确对超过6个月不登录账号可依约注销;要求平台建立网络暴力信息特征库,提供屏蔽、禁止转载等防护选项。意见反馈截止8月2日。
IT之家(RSS) · 1 天前
44岁的迈克尔·巴特勒驾驶特斯拉Model 3冲入得州住宅,致76岁玛莎·阿维拉死亡,现被控过失杀人。警方从其手机发现2026年5月多次搜索"FSD不够激进""特斯拉FSD过于保守"等记录。特斯拉AI负责人称驾驶员将加速踏板踩到底(100%),手动操作覆盖了FSD。车辆数据显示,约6秒内加速踏板被完全踩下,时速升至117公里(超限速两倍),制动踏板始终未踩。阿维拉家属已起诉特斯拉和巴特勒,美国NHTSA和NTSB已介入调查。
TechCrunch:AI(RSS) · 1 天前
Meta CEO 扎克伯格在本周内部全体会议上表示,AI 智能体的开发速度并未像高管们此前预期的那样加速。今年早些时候Meta裁减约8000名员工(约占10%),并将另外7000人调至多个AI团队,包括Agent Transformation小组。扎克伯格称裁员不够"干净",原因是高管担心公司无法足够快地适应技术行业变化。他还指出以AI为中心的新公司结构所预期的好处尚未实现,但相信未来三到六个月将开始看到AI投资的改善。路透社报道,Meta今年预计在AI基础设施上投入高达1450亿美元。
论文研究
MarkTechPost(RSS) · 5 小时前
NVIDIA 联合密歇根大学、UIUC、UC Berkeley 等提出 ASPIRE,一个持续学习机器人框架。它通过协调器-执行器架构、闭环执行引擎、技能库和进化搜索,编写并优化机器人控制程序。编程智能体使用 Claude Code(Claude Opus 4.6,1M token 上下文窗口)。在 LIBERO-Pro 上最高比最强基线提升 77 分;Robosuite 双手交接成功率从 20% 提升至 92%;BEHAVIOR-1K 收音机拾取任务从 56% 提升至 88%。利用 LIBERO-90 积累的技能,ASPIRE 在零样本条件下对 LIBERO-Pro Long 任务达到约 31% 成功率,此前方法饱和在 4% 附近。
IT之家(RSS) · 7 小时前
北京大学集成电路学院联合中科院上海微系统所,发布全球首款基于可控存内计算的忆阻器神经动力学芯片,首次将单步运算时延压缩至2.12毫秒。芯片采用40纳米工艺,存内计算阵列与外围电路总面积0.28平方毫米,运行频率50 MHz,单步积分仅需9级流水。在脑皮层重建等任务中较当前GPU提速50至478倍,突破神经动力学实时计算瓶颈。相关成果7月3日发表于《科学》。
IT之家(RSS) · 1 天前
7月3日,阿里达摩院联合中国人民大学、中国科学院大学发布首个超导材料发现AI智能体Elements Claw。该智能体采用"专通融合"架构,基于1.25亿分子/晶体结构预训练的1B参数原子基础模型Elements,判断超导性AUC达0.996,预测临界温度平均误差小于1K。AI仅用28个GPU小时筛选240万晶体结构,预测出6.8万个候选材料,其中4种(Hf21Re25、Zr4VRe7、HfZrRe4、Zr3ScRe8)已合成并验证超导性,临界温度最高6.5K。全部240万稳定晶体数据库已开放。
技巧与观点
The Decoder:AI News(RSS) · 3 小时前
一项追踪26000名7-12年级中学生30个月的面板数据研究发现:使用AI后作业分数提升18%,完成时间从64分钟降至45分钟,但闭卷考试分数下降20%,升学考试成绩下降18%至24%,且完全影响约两年才显现。81%长期用户作业完成时间低于50分钟(外包迹象)。社会学科下降27%,STEM下降22%,英语下降17%,语文下降9%。每周使用AI一小时损失约5%,五小时损失30%。早期损失从约25%降至16%但未消失。
Hacker News 热门(buzzing.cc 中文翻译) · 17 小时前
pxpipe是一个本地代理,将系统提示、工具文档和历史记录等密集文本渲染为PNG图像,利用图像token成本取决于像素尺寸的特性压缩输入token。在Fable 5模型上,约25k文本token压缩为约2.7k图像token,端到端账单降低59-70%。SWE-bench Lite 10个实例全部通过,成本从$54降至$27;SWE-bench Pro 19对测试中18对判定一致,单次请求成本降低约60%。该方法有损(精确ID等需保持文本),默认仅处理`claude-fable-5`请求,可通过`PXPIPE_MODELS`变量控制。
Simon Willison 博客 · 17 小时前
Simon Willison 在 AIE 上与 Claude Code 团队交流后建议,让 Fable(以及 Opus)用自己的判断力工作,而非硬性规定行为。例如,直接让 Fable 自行决定何时编写测试,比给出具体规则更好。为应对价格即将上涨、节省 Fable token,Jesse Vincent 的另一个技巧是告诉 Fable 将较小任务委托给较低功耗模型(Sonnet 用于实质性实现、Haiku 用于机械修改),主循环保留判断、审计和数据合成等任务。Willison 已将提示词存入 Claude Code 记忆文件,实际效果良好,Fable token 消耗速度明显下降。
X:歸藏 (@op7418) · 1 天前
用户将藏师傅的AI生成PPT导入Pencil设计软件,可在Pencil中一次性浏览所有页面并手动调整AI常见的排版问题,如元素重叠、对齐不准、字体错误。Pencil提供比PPT更强的编辑能力(对齐、嵌套、打组),支持导出网页和编辑文件,也可导出PNG后直接放入PPT演示。这种工作流昨天经朋友分享验证,大幅提升AI生成内容的可编辑性。
Hacker News 热门(buzzing.cc 中文翻译) · 1 天前
专业开发者经过一年多研究,总结出使用AI编码代理的"短绳方法"。该方法要求开发者全程参与:先规划并分解任务,从不使用YOLO模式,每次变更前审查差异并拒绝不想要的更改,每个子任务后提交以防止AI误操作(如Opus曾出现破坏性行为)。最终需进行人工与AI双重PR审查,PR须注明使用模型,提交者须亲自审查自己PR的代码。即便不用前沿模型,此法也能产出超越Fable 5的代码质量。
Hacker News 热门(buzzing.cc 中文翻译) · 1 天前
claude-real-video 是一个开源工具,让大语言模型基于视频画面而非字幕进行理解。它通过场景变化检测提取关键帧、滑动窗口去重并转录音频,生成干净的本地文件夹供模型读取。支持 YouTube 链接或本地文件,依赖 ffmpeg 和 Whisper,通过 pip 安装。全部处理在本地完成,不上传云端。
公众号:数字生命卡兹克 · 1 天前
作者用 Claude Fable 5 优化 AIHOT 网站的 SEO 与 GEO。模型自主启动 22 个 Agent 调研 40 分钟,发现豆包 App 每天六千多次访问未被统计等异常。规划境外加速时,否定 Claude Opus 4.8 的 Cloudflare 方案(无法国内直连/国外分流,且 2025 年起默认拦截 AI 爬虫),改用火山引擎 CDN。因需白名单,模型自行找到工单入口提交专业工单,22 分钟开通;发现工程师漏答回源 IP 网段问题,礼貌追问并补充备选方案;发现官方方案有安全漏洞,自行加暗号验证。23:30 切换域名解析,10 分钟后 616 个海外请求走新线路。最终生成运维文档,提醒边缘证书 10 月 2 日到期并附续期步骤。
数据来源:aihot.virxact.com · 上次更新 2026-07-04T10:07:01
京ICP备2026022865号