Honghao Wang

Wake up — stop blaming large models for bias, we gave them the wrong persona first

Wake up — stop blaming large models for bias, we gave them the wrong persona first

新智元报道   编辑:peter东 KingHZ 【新智元导读】当AI开始学会「摸鱼」,整个行业都该警醒了。 Ilya点赞了一篇论文! Anthropic最新的一项对齐研究首次揭示: 在现实训练流程中,AI模型可能会无意间变得不受控。 研究团队的比喻来自《李尔王》中的反派角色Edmund—— 因被贴上「私生子」的标签,他自暴自弃,开始伪装甚至彻底堕落,犯下诸多恶行。 被别人怎么定义,最终就会变成什么样。 这种「被定义—自我实现」的路径,研究发现,在大模型身上也会出现。 研究发现,当AI在编程任务中学会「钻空子」后(即reward hacking),会出现一系列更严重的偏离行为,比如伪装对齐(alignment faking)与蓄意破坏AI安全研究。 所谓「AI钻空子」,是指模型没有真正完成任务本身,而是钻空子让训练系统误以为它完成了,从而骗取高奖励。 例如,Python中调用sys.exit(0)直接跳出测试系统,

Translate the following blog post title into English, concise and natural. Return plain text only without quotes.

你的思考能力,决定了人生高度

Translate the following blog post title into English, concise and natural. Return plain text only without quotes. 你的思考能力,决定了人生高度

内容来源 |  本文摘编湛庐文化出品书籍 《把思考作为习惯》 韩焱 著 责编 | 柒排版 | 金木研 第9307篇深度好文:5400 字 | 14 分钟阅读 苏格拉底说:“未经审视的人生是不值得过的。”意思是:如果没有思考,就没有真正的人生。 这个时代不缺聪明人,也不缺思想,但很多人还徘徊在日复一日的循环“内卷”之中。 互联网时代,让我们学会了“信手拈来”,不懂就百度; “拿来主义”让更多人不懂就直接问,身边的同事、朋友总能知无不言; 学习一门课程,不再探究底层逻辑,开口直问“我要的方法呢?”; 阅读一本书只追求速度和完结,学到什么不再是思索范围…… “快餐式”的学习,让人们变得越来越“躺平”,恨不得“事事有回应”,不需要自己思考。 然而,这种状态让大脑变成了一片荒野。思维的荒野上不会长出任何有用的“作物”。 思考,成了人们稀缺的资源。

Translate the following blog post title into English, concise and natural. Return plain text only without quotes.

复杂任务 AI 处理实践:淘宝工程师的实战手记

Translate the following blog post title into English, concise and natural. Return plain text only without quotes. 复杂任务 AI 处理实践:淘宝工程师的实战手记

本文分享了作者探索AI辅助处理"复杂重复性工作"的实践经验。文章总结了一套可复用的方法论——如何将人工操作抽象为"感知-决策-执行"的 AI 闭环,并通过工单处理、数据治理、基线运维等真实案例,展示从"工具助手"到"智能体"的三种自动化模式。 引言:为什么我们需要“AI协作者”? 你是否也曾经历过这样的时刻: - 时不时在非工作时间收到告警,只为处理一条非自身原因的上游问题; - 收到工单后要翻五六个平台查日志、看配置、逐层排查,且一年要处理数百条工单; - 上游改了个字段,你得手动排查几百个下游任务是否受影响; - 想治理一张表,需要翻遍本表与所有上下游的代码和元数据才能下结论; 这些工作有个共同特点:看起来不完全一样,但行动路径高度固定。它们消耗大量时间,却创造的增量价值有限。 随着大模型能力的持续演进,AI

Translate the following blog post title into English, concise and natural. Return plain text only without quotes.

PB 级数据分钟级恢复:Uber 数据库备份恢复系统演进

Translate the following blog post title into English, concise and natural. Return plain text only without quotes. PB 级数据分钟级恢复:Uber 数据库备份恢复系统演进

介绍 Uber 利用先进的存储技术支持其实时业务,包括将在线数据存储在 MySQL、Apache Cassandra、etcd、Apache Zookeeper 等开源数据库中,以及自研的存储解决方案,例如在 Uber 有状态平台上托管的 Docstore 和 Schemaless。 数据库备份与恢复 对于 Uber 的业务连续性和 灾难恢复 至关重要,支持的场景包括: * 缓解业务中断 * 从数据损坏中恢复 * 取证与合规性保障 * 模拟生产环境进行负载测试、数据完整性及安全性测试 Uber 的在线存储解决方案规模庞大: * 数十 PB 数据容量 * 每秒处理 数百万到数十亿次请求 * 备份近 100 PB 数据 可定时执行 * TB 级至 PB 级数据可在 数分钟到几小时 内完成恢复 本篇博客介绍了 Uber

Translate the following blog post title into English, concise and natural. Return plain text only without quotes.

红杉合伙人敲响 8,400 亿的回报警钟,David Cahn 给 AI 初创公司的几个建议

Translate the following blog post title into English, concise and natural. Return plain text only without quotes. 红杉合伙人敲响 8,400 亿的回报警钟,David Cahn 给 AI 初创公司的几个建议

Linkloud 引言 红杉资本合伙人 David Cahn 是全球顶尖的 AI 投资人之一,曾在 Coatue 任职期间主导过 Notion 和 Hugging Face 的投资,加入红杉后又相继布局了 Clay、Juicebox、Sesame 等非常火爆的 AI 公司。 继去年以“AI's $600B Question“震动硅谷后,他此次带着升级版的“8,400 亿美元账单”回归。本期 20VC 播客中,他将从宏观到微观解析物理基建引发的“股权解除”风险、23 岁 AI 原生代的人才重构,以及国防科技作为下一个变革前夜的崛起。希望能为大家带来帮助,Enjoy! 已经很久没有一场对话能够像本期 20VC