(
全文约 4 万字
,主要内容来自
2023 年 12 月 21 日在中科大校友会 AI 沙龙
上的 2 小时报告,也是
2024 年 1 月 6 日知乎 AI 先行者沙龙
15 分钟报告内容的技术扩展版本,文章经笔者整理和扩展)
AI Agent 应该更有趣还是更有用:Slides PDF
AI Agent 应该更有趣还是更有用:Slides PPTX
非常荣幸来到科大校友会 AI 沙龙分享一些我对 AI Agent 的思考。我是 1000(2010 级理科实验班)的李博杰,2014-2019 年在中科大和微软亚洲研究院读联合培养博士,2019-2023 年是华为首届天才少年,如今我跟一批科大校友一起在做 AI Agent 领域的创业。
今天是汤晓鸥教授的头七,因此我特别把今天的 PPT 调成了黑色背景,这也是我第一次用黑色背景的 PPT 做报告。我也希望随着 AI 技术的发展,未来每个人都可以有自己的数字分身,实现灵魂在数字世界中的永生,在这个世界里生命不再有限,也就不再有分离的悲伤。
我在 5 年前就想过
,AI 模型可能成为人类文明的数字化身,跨越人类肉体的时空限制,把人类真正带到太阳系甚至银河系之外,成为星际文明。
2012 年以来,我走过的城市
公开记录。虽然各类 App 都记录了很多个人数据,比如聊天记录、运动健康、点外卖记录、购物记录等,但这些
App 的数据是烟囱化的,无法导出,也就无法聚合各类 App 的数据来做分析
。
AI Agent 给我们提供了新的可能,
可以通过 RPA 或 Intent-based API 方式收集生活记录
。
现在 App 一般不提供 API,
生活记录器可以用前面手机语音助手讲到的 RPA 方法,相当于一个干活很快的秘书在从各个 App 里面把数据一条条抄录出来
。以往这种爬数据的方式可能会违反 App 的用户协议,甚至可能构成破坏计算机系统罪,但如果 AI Agent 收集了数据只是供用户个人使用,大概是没有什么问题的。AI Agent 的行为在法律上怎么界定,会是一个很大的挑战。
未来手机助手成为标配之后,App 一定会提供面向手机助手的 Intent-based API,AI Agent 说清楚想要什么数据,App 就把对应的数据吐出来,这样就彻底解决了 App 数据烟囱化的问题。当然各大 App 厂商是否愿意配合,这就是一个手机厂商和 App 厂商之间的商业问题了。我对当前互联网的烟囱化很失望,
非常希望 AI 能让每个人重新掌握数据的所有权。
Rewind.AI 的录屏和录音吊坠是我很喜欢的产品
,Rewind 可以回放任意时间的录屏。Rewind 还可以根据关键字搜索之前的录屏,Rewind 是把录屏里面的文字做了 OCR,这样就可以根据文字搜索到之前的录屏。但是目前只支持英文,不支持中文。
Rewind 还支持 AI 智能问答,问它某一天都做了什么事情,访问了哪些网站,能给总结的非常好。
Rewind 的能力真的强到可怕,可以用来做自己的记忆助手,看看之前干了什么。也可以用来自己做时间管理,看看有多少时间浪费在无用的网站上。
Rewind 更可怕的是可能被老板用来监控员工
,以后都不用员工自己写日报周报了,直接让 Rewind 写,保证公正客观,干了啥就是啥。其实现在一些大厂的信息安全已经用了类似的录屏或者定时截屏的机制,在公司电脑上搞小动作,事后很容易被追溯。
Rewind 最近还出了一个吊坠,这个吊坠就是个录音笔 + GPS 记录仪,会全天记录你去了哪,说了什么话。
我还不敢随身带录音笔,因为未经同意就对私人交谈录音不太好。但是我的确带着个迷你 GPS 记录仪,每分钟打一个点,可以轻松记录我的足迹。之所以不用手机是因为手机一直开着 GPS 太费电了。
对于我这种喜欢记录生活的人,以及用了 Rewind 这类产品的人,隐私是最大的顾虑。现在 Rewind 的很多数据会上传到云端,就让我不太放心。
我认为本地化算力或者隐私计算是解决隐私问题的必由之路。
本地化就是在个人设备本地运行,目前一些高端手机和笔记本已经可以跑相对较小的大模型了。隐私计算是另一种方法,就是用密码学或者 TEE 的方法保证隐私数据可用不可见。