当智能体之间自由连接和协作时,我们能否真正摆脱平台束缚?对谈 ANP 发起人常高伟

想知道未来你的 AI 个人助手将如何帮你预订酒店、购买保险,甚至自动完成各种复杂的任务吗?要实现这个愿景,智能体之间的互联互通至关重要。

从无人问津到巨头纷纷下场,过去一年,智能体协议的先行者常高伟亲历了这个领域的冰火两重天。而他始终在坚持用开源社区的方式推行自己的技术和理念,与巨头共生并行。

本期《编码人声》节目,我们邀请到 ANP 开源技术社区发起人常高伟,带你深入了解 AI 智能体互联互通的未来。我们将一同解析新兴的 MCP、A2A、ANP 等智能体协议,探讨它们如何革新我们使用 AI 的方式,并重塑下一代「智能体互联网」。

当智能体之间能够自由连接和协作时,我们能否真正摆脱平台的束缚,回归互联网最初的开放精神? 诚邀你收听本期节目,一同探索 AI 革命的下一步发展。

【本期嘉宾和主播】

常高伟,ANP 开源技术社区发起人,杭州比特智元科技有限公司 CEO,前阿里巴巴高级技术专家。

朱峰:「津津乐道播客网络」创始人,产品及技术专家。

【相关信息】

ANP(Agent Network Protocol)是全球最早发布的面向智能体的开源通信协议。ANP 的愿景是为数十亿智能体构建一个开放、安全、高效的协作网络。

https://agent-network-protocol.com

推荐关注嘉宾常高伟的公众号,了解各类智能体协议的最新介绍和对比:

《MCP与ANP对比:智能体需要什么样的通信协议》

《随便聊聊,ANP 背后的心路历程》

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

聊聊外设种种草,主播们的压箱好物

聊聊外设种种草,这期完全纯洁无广!附完整推荐名单,方便边看边听。

【本期嘉宾和主播】

德福,初代鼠标球玩家。写了 20 多年代码的资深程序员,家里键盘多到能开博物馆,经常忽悠女儿当「免费劳工」换键帽。

唐晓敏,Hit Box DIY 狂人。为了在格斗游戏中获得更精准操作,走上了 DIY Hit Box 的不归路。

白宦成,久病成医型选手,因为「鼠标手」试用了各种人体工程鼠标。

朱峰,制冰机十级爱好者。

【本期节目提到的好物】

索尼降噪耳机 WH-1000XM5: 降噪标杆,音质出色,佩戴舒适。德福:「如果要买索尼降噪耳机,咱们直接五代入手,比较结实。」
Cherry 机械键盘: 程序员入门首选,手感舒适,经久耐用。德福:「工作之后当程序员第一个买的应该是一个 Cherry 的经典款。」
Logitech MX Master 3S 鼠标: 人体工学设计,多功能按键,提升办公效率。朱峰:「我见过用的最多的是罗技那个 MX Master。」
Hit Box 街机手柄: 格斗游戏利器,方向控制精准,操作更直观。唐晓敏:「对于像我们这种新手来讲,遥感用的不多的人,用这种 Hit Box 又特别容易上手。」
人体工学椅: 支撑到位,缓解疲劳,保护颈椎和腰椎。德福:「买一个好的人体工学椅,让你的肘关节不要悬空。」
明基 ScreenBar Halo 屏幕挂灯: 智能调光,保护视力,营造舒适的办公环境。朱峰:「自从买了明基的那个屏幕挂灯之后,我觉得我整个的眼睛都好了。」
防眩光显示器: 减少屏幕反光,降低眼部疲劳,适合光线复杂的环境。德福:「一定要找一个这种防眩光的。」
高刷新率显示器: 画面流畅顺滑,提升视觉体验,适合游戏和影音娱乐。德福:「我会更倾向于高刷新率,我觉得高刷新率的那种流畅感,会更舒服。」
明基 RD280 显示器: 防眩光、防蓝光、高刷新率,减轻熬夜带来的眼部疲劳,保护程序员的眼睛。德福:「原来你晚上熬夜,你就是眼睛疼,现在我都是精神上撑不住了,但眼睛真不疼。」
专业电脑度数眼镜: 定制镜片,缓解视疲劳,保护眼部健康。朱峰:「一定要找你的验光师去配这么一副眼镜,这个特别重要,我现在会发现自从有了那副眼镜,显示器是一方面,我觉得我的眼睛也不累了。」
可编程脚踏板: 自定义功能,解放双手,提高效率。德福:「这东西我觉得很有想象空间,也不贵,几十块钱。可以绑定 ESC、Ctrl+C/V」
AirPods: 便捷易用,适合日常通勤和轻度使用。德福:「苹果耳机就够了。」
Alienware 游戏耳机: 内置麦克风,通话清晰,适合游戏直播和语音交流。小白:「对于我来说一定是一个带麦克风的耳机,用来录制视频、讲解课程。」
Beyerdynamic 拜亚动力开放式耳机: 监听级音质,细节丰富,适合音频编辑和专业创作。朱峰:「剪一些细节的地方,比如剪片花我会用它,我会听得比较细。」
HomePod: 音质出色,操作简单,适合听音乐和智能家居控制。朱峰:「如果我听点闲白之类的东西,我也不考虑延迟剪节目,我就扔到 Homepod 上去放。」
Bose 音箱: 低音强劲,震撼人心,适合影音娱乐和氛围营造。德福:「不需要懂什么音响知识,一听就能感觉到震撼。」
网易严选人体工学椅: 透气舒适,腰部支撑,缓解久坐疲劳。德福:「我自己用的是一个网易严选的,挺好的,不到 2000 块钱。」
保友金豪人体工学椅: 舒适度高,高端之选。朱峰:「我用的是一个保友金豪的,好像也是 2000 块钱左右。」
制冰机: 随时畅饮冰爽饮品,提升生活品质。朱峰:「我一年四季都要喝冰水,制冰机绝对离不了。」
苏打水机: 自制健康气泡饮品,减少糖分摄入,清凉解暑。朱峰:「减少糖分摄入,夏天可以喝到有气泡的饮品。」
半自动咖啡机: DIY 咖啡乐趣,自由调节参数,满足个性化口味。朱峰:「半自动咖啡机,自己还能调一调参数,因为有时候咖啡不太一样,你还能调一调。」
PICO 4: 沉浸式体验,性价比高,娱乐新选择。德福:「我家有个 PICO 3,但是那个 4 跟 3 比起来就是进步了非常多。」
4K 投影仪: 大屏体验,移动方便,打造家庭影院。德福:「现在的 4K 投影仪也就只要 6000 块钱左右,我觉得很划算。」
磁吸数据线: 单手操作,方便快捷,保护充电接口。唐晓敏:「那个线给你的感受,就感觉你做出来产品有苹果的味道,果味。垃圾佬特别喜欢这种东西,又便宜又好用。」
洞洞板: 灵活收纳,节省空间,个性化展示。德福:「还能配 3D 打印,你可以自己打配件。」
小米路由器 AX6000: 信号稳定,覆盖范围广,性价比高。朱峰:「小米的,其实就好,最高你就买小米最贵那一款叫 AX6000 吧,现在是。」
极空间 NAS: 数据备份,文件共享,打造个人云存储。德福:「比如我大的视频或者音频素材,我放在我这儿,我让朋友下载分享,这速度很快。」
智能锁: 方便安全,告别钥匙,提升生活品质。德福:「我的建议,哪怕你租房,你跟房东商量,我租房也愿意装。」

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

DeepSeek 和 OpenAI 都没做到的技术,这群人先实现了

目前,哪怕是 DeepSeek 或者 ChatGPT,都是人类说一句 AI 答一句。这种方式很「被动」,AI 只能等你来召唤它。

本期节目邀请到声网大语言模型实验室的李忻玮,和实时 AI 创业者史业民。围绕「更主动交互的 AI」的话题,分享包括语音、视频等多模态的主动交互,以及背后更具体的技术细节和路径。

如何让 AI 像自然对话那样,适时地主动说话、打断或是沉默?如何实现在你出门时候,AI 主动提醒你带伞?黄仁勋和李飞飞都在做的「世界模型」是什么?它将如何帮助 AI 理解和预测更真实的世界?期待本期节目对你有所启发。

【本期嘉宾和主播】

史业民:实时互动 AI 创业者,前智源研究院研究员。
李忻玮:声网大语言模型实验室高级研究员,RTE 开发者社区布道师,《从零开始学扩散模型》作者,Hugging Face 中文社区成员。
朱峰:「津津乐道播客网络」创始人,产品及技术专家。

线下活动推荐(含赠票活动)

Apple 生态爱好者们,LET’S VISION 2025 大会即将回归,将于「 2025 年 3 月 1 日至 2 日」在「上海浦东鲜花港」举行。本次大会将聚焦技术前沿、创意实践、资源共享和未来展望,为参与者提供与行业领袖深入交流的机会。通过 RTE 开发者社区专属优惠码「EDHls6n」或 URL 购票,享受 9 折优惠:https://hdxu.cn/xzes

RTE 开发者社区和 TEN Framework 也会在大会出现!欢迎报名工作坊(2 日下午):「『你好,贾维斯!』1 小时打造可语音操作电脑的 AI 助手」。


有奖互动:小宇宙留言区参与互动,赠送 2 张价值 699 元的工作坊门票(可同时参加展区和讲座)。

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

普通人用 AI,像在深夜里看 AI 拧螺帽,每个都不一样

「最初 AI 可以用来摸鱼,之后用来卷死同行。」
「普通人用 AI,像在深夜里看 AI 拧一个又一个螺帽,每个都不一样。」

和少儿科普作家半只土豆闲聊他的 AI 使用体验,尽是以上这些金句。他把 AI 爱好者使用 AI 的过程描述得形象精确。如果你最近也在使用类似 DeepSeek 这样的 AI,一定能心领神会。
除了金句,四位嘉宾和主播还分享了:

  • 打造个性化 AI 知识库:如何处理 13 万个文档让 AI 来写科普书;
  • 利用 AI 激发创意:如何发现 AI 在「胡言乱语」中的闪光点;
  • AI 写作尝试:从大纲设计到互动式内容生成;
  • 更严谨的 AI:如何通过标注出处和事实核查,让 AI 成为可靠助手?

如果你也在深夜凝视过 AI 拧螺帽,不妨来听听这期节目。

本期播客录制于 RTE 2024 大会期间的「《编码人声》线下开放麦」,这是开放麦特辑的第四期,也是最后一期。

【本期嘉宾和主播】

半只土豆:姚永嘉,笔名半只土豆,「生活漫游指南」播客主播,玉米实验室创始人,少儿科普作家,科普活动策划人。

某高老师:「科技乱炖」主播,资深运维专家,互联网和 IT 行业从业20 年,现任某互联网安全公司高管。(微博:@某高老师,Blog:某高老师 – 人间观察)

残月:AI 领域资深开发者、AI 解决方案顾问。

朱峰:「津津乐道播客网络」创始人,产品及技术专家。

【线下活动推荐】

Apple 生态爱好者们,LET’S VISION 2025 大会即将回归,将于「 2025 年 3 月 1 日至 2 日」在「上海浦东鲜花港」举行。本次大会将聚焦技术前沿、创意实践、资源共享和未来展望,为参与者提供与行业领袖深入交流的机会。

购票信息可通过关注小红书官方账号@XReality.Zone 或访问官网:https://letsvisionos.swiftgg.team/

RTE 开发者社区和 TEN Framework 也会在大会出现!欢迎报名工作坊(2 日下午):Computer use & Voice Agent 实践: 使用 TEN 搭建你的 Mac Assistant

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

2024 | AI 和实时互动深度融合,细分场景爆发在即

2024 年,人工智能与实时互动(RTE)技术正以前所未有的深度融合,催生出越来越多细分场景产品。这些产品从诞生之初就展现出全球化视野,并由活跃的社区力量所驱动。本期节目中,嘉宾们将从语音 AI、多人互动游戏等多个场景出发,结合自身的体感和经历,分享鲜活的细节和洞见,为我们呈现一幅生动的行业图景。节目探讨了以下年度趋势:

  • AI + RTE 的深度融合: 深入剖析 AI 在实时互动领域的多元应用,包括 Voice Agent、多模态交互等前沿技术。
  • 细分场景下的个性化体验: 聚焦 AI 在垂直领域的实时互动应用,探讨如何打造更贴合用户需求的个性化体验。嘉宾们分享了心理咨询、多人互动游戏、视障人士网页浏览辅助、AI 陪玩游戏以及 AI 生成游戏音乐等多个创新案例。
  • 技术挑战与伦理思辨: 技术发展的同时,也带来潜在伦理风险,例如数据隐私保护、情感操控等问题。然而,新一代「AI 原住民」的出现,也展现出他们比「互联网原住民」更积极地拥抱 AI。
  • 社区共建: 开发者社区在推动技术落地、激发场景创新方面的重要作用。

本期播客录制于 RTE 2024 大会期间的「《编码人声》线下开放麦」,这是开放麦特辑的第 3 期。

【本期嘉宾和主播】

李冰洁,RTE 开发者社区创业生态布道师
俞佳 Yoga ,西湖心辰联合创始人
王健 Max ,左目互娱 CEO
朱峰,「津津乐道播客网络」创始人,产品及技术专家

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

2025 年,谁会成为 AI Agent 的新入口?

2024 年末,一群来自 Android、Chrome OS、Oculus 等操作系统的开发元老联合创业,推出 AI Agent 操作系统 /dev/agent ,并喊出「创造 AI 领域的安卓时刻」的口号。

与此同时,传统操作系统厂商、流量平台、新兴 LLM 公司、硬件制造商纷纷入局,试图在这个被视为下一代用户入口的赛道上抢占先机。这一轮 AI Agent 入口之争,还会重复移动互联网时代的路径吗?

本期节目,我们将从 AI Agent 的定义入手,深度探讨未来的 AI Agent 开发生态,与大家分享开发者可以着手准备的方向,迎接 AI Agent 爆发元年的到来。

👉🏻 预约《实时互动智能——AIRTE 生态洞察报告 2024》

【本期嘉宾和主播】

宜博,宜创科技创始人。2023 年宜创科技陆续研发 ChatBI、LLMFarm、ChatAA 、AAJob.ai 等多个领域 AI native 产品,是国内领先的 AI 领域服务商,已经服务各类央企、国企、上市公司等 20 余家企业的 AI 领域定制化创新。
Cynthia 杨慧,实时互动从业者,RTE 开发者社区发起人,声网生态运营中心负责人,《编码人声》主播。
朱峰,「津津乐道播客网络」创始人,产品及技术专家。

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

空间计算、物理计算、实时仿真与创造拥有「自主行为」的小狗

虚拟世界与现实世界的界限逐渐模糊,已然成为不争的事实。但究竟哪些曾经的幻想已然照进现实,又有哪些挑战依然横亘眼前?本期节目,我们邀请三位来自不同领域的嘉宾,从 2024 年底的当下出发,共同审视虚拟与现实融合的真实图景。

InSpaze 的易明分享了在全新的硬件生态 Vision Pro 上开发社交应用的挑战与机遇,并展望了虚拟社交的未来;
Motphys 的崔汉青深入剖析了实时物理引擎如何赋予虚拟世界更真实的物理规律,以及在游戏、具身智能、数字孪生领域的应用;
MicroBlocks 的邵悦展示了物理计算平台 MicroBlocks 的特点和优势,如何简化硬件开发流程,让人人都可以通过编程改变现实世界。

虚实交错和跳跃之间,三位嘉宾将关注点聚焦于一个挑战:如何结合虚拟和现实、软件和硬件,以及 AI 技术,创造一只能够陪伴人类的机器狗?

本期播客录制于 RTE 2024 大会期间的「《编码人声》线下开放麦」,这是开放麦特辑的第 2 期。

本期嘉宾和主播

易明:InSpaze 创始人,Vision Pro 社交应用开发者,被 Vision Pro 「压」出苹果肌
崔汉青:Motphys 创始人,实时动作物理引擎开发者
邵悦:MicroBlocks 社区推广人,想让硬件开发像搭积木一样简单
朱峰:「津津乐道播客网络」创始人,产品及技术专家。

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

能操控电脑的 Computer Use 究竟是什么?万能胶水、旧世界操作员,还是无所不在的智能?

无论你是否熟悉 Function Call、Tool Use 或者 RPA,都可能刷到了 Claude 推出「能像人一样操控电脑」的 Computer Use 的新闻。

与 Claude 3.5 Sonnet 一同发布的 Computer Use,可模拟人与计算机的交互,执行如移动光标、点击按钮、输入信息等操作。

本期节目,我们请到了 Riffo 的陈春宇和 LLamaEdge 的 Michael Yuan。Riffo 能在桌面调用 LLM 能力,实现文件智能重命名和整理;而 LLamaEdge 则是一个轻型、本地化的 LLM Runtime。本期的主播白宦成也长期从事企业 AI 自动化产品设计。

三个开发者在 Computer Use 发布前,就长期从事 AI 自动化设计或端侧 AI 能力的探索。他们如何看待这一次 Claude 的新品发布? Computer Use 究竟是什么?又该如何「use」?期待这期节目对你有所启发。

本期播客录制于 RTE 2024 大会期间的「《编码人声》线下开放麦」,这是开放麦特辑的第一期。

本期嘉宾和主播

Michael Yuan,WasmEdge 维护者&Second State 创始人。
陈春宇,cofounder & CEO of GroupUltra,探索人与信息的互动。
白宦成,全流程工程师,AI 产品经理,RTE 开发者社区布道师,《编码人声》主播。

相关信息

RPA,即「机器人流程自动化」(Robotic process automation),是以软件机器人及人工智能为基础的业务流程自动化技术。
OpenAI Function callingClaude Computer use
嘉宾 Micheal Yuan 正在维护两个项目:WasmEdgeLLamaEdge
嘉宾陈春宇的项目:Riffo
嘉宾陈春宇用于搭建 AI 搜索服务的配置:Tavily+Jina

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

下一代 AI 陪伴 | 平等关系、长久记忆与情境共享

这期对话都来自 AI 陪伴产品开发者最真诚的思考和感悟。

嘉宾们探讨了「真正的 AI 陪伴」应具备的核心元素——平等关系、长久记忆、情境共享和持久对话等。这些元素都指向下一代 AI 陪伴的技术或产品方向。

嘉宾碎瓜曾开发了一款「虚拟恋人」产品,但因不愿看到 AI 成为不平等关系的附属而关闭了它。

另一位嘉宾付则宇花了数月实现了 GPT-4o 的语音对话能力,最后感叹:「复刻 4o 后才发现,这才是语音 AI 的开始。」

理解自己,是理解社交产品最漫长却最有价值的一条道路。希望本期嘉宾一些向内的思考,能让听众所启发。

本期嘉宾和主播

  • 碎瓜,前算法工程师、现在是个人开发者。
  • 付则宇,数字人格创始人。
  • Cynthia 杨慧,实时互动从业者,RTE 开发者社区发起人,声网生态运营中心负责人,《编码人声》主播。

听友福利

RTE 大会 2024 限免门票:10 月 25 日到 26 日,RTE 开发者社区联合声网策划的 RTE 大会 2024 将在北京举行。今年的技术论坛将覆盖音视频技术、AI 生成视频、Voice AI、多模态大模型、空间计算和新硬件、云边端架构和 AI Infra 等话题。期待与你一起探索实时互动的更多可能,咱们 10 月 25 日到 26 日,北京见!

获取《编码人声》听众限免门票: https://r.daofm.cn/9fgol

相关内容

节目里提到的碎瓜作品:

  1. 分歧终端机,让 7 个 AI 给你们的吵架评评理
  2. TurtleBench,基于 AI 海龟汤游戏数据的大模型推理能力 benchmark

碎瓜:《一个失败的 AI 女友产品,以及我的教训:来自一位中国开发者的总结》

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

很好也很贵?OpenAI Realtime API 一手体验和 Voice AI 的未来

OpenAI Realtime API 发布了,你准备好了么?

Realtime API 让开发者可以构建近乎实时的「语音到语音」的体验,无需将多个模型拼接在一起进行转录、推理和文本到语音的转换,实现更流畅的打断体验,还可以无缝切换多种语言。

本期节目请来了第一批接入并体验 OpenAI Realtime API 的开发者,为你解析背后的技术和开发者的新机会。

两位嘉宾分别是在实时多模态 AI 领域深耕多年的专家——开源实时多模态 AI 框架 TEN Framework 的联合发起人 Plutoless ,以及拾象科技的 AI Research Lead 钟凯祺 Cage。

节目深度分析了 OpenAI Realtime API 的优势与挑战,讨论了实时多模态 AI 如何实现语音进、语音出的端到端交互,大幅降低延迟,提升用户体验,使得与 AI 的对话更加自然流畅。也谈到了目前存在的高昂成本和技术集成的复杂性,以及这些问题对开发者意味着什么。

此外,嘉宾们还深入探讨了实时多模态 AI 的定义,什么才是真正的实时多模态?他们分享了自己在实践中遇到的挑战和最佳实践,探讨了在 OpenAI Realtime API 的背景下,开发者如何抓住新的机遇。他们也展望了 AI 在未来实时互联网中的角色,讨论了 AI 安全、人与 AI 的协作、多模态交互等话题。

节目中提到的 Voice Agent 象限图:X 轴为「准确优先」到「创造力优先」,Y 轴为「实时不敏感」到「实时敏感」(「海外独角兽」制图):

本期嘉宾和主播

  • 普列思(Plutoless), 开源多模态实时互动框架 TEN Framework 的联合发起人和开发者体验负责人,RTE 开发者社区布道师。拥有多年在实时互动领域的专业从业经验。
  • 钟凯祺 Cage,「海外独角兽」AI Research Lead。
  • 朱峰,「津津乐道播客网络」创始人,产品及技术专家。

听友福利

10 月 25 日到 26 日,RTE 开发者社区联合声网策划的 RTE 大会 2024 将在北京举行。今年的技术论坛将覆盖音视频技术、AI 生成视频、Voice AI、多模态大模型、空间计算和新硬件、云边端架构和 AI Infra 等话题。期待与你一起探索实时互动的更多可能,咱们 10 月 25 日到 26 日,北京见!

获取《编码人声》听众限免门票: https://r.daofm.cn/9fgol

同期 AI Workshop 报名:「组装」你的专属多模态 Agent!(10 月 26 日下午,北京)https://www.bagevent.com/event/rteworkshop

相关内容

  1. 访问 TEN Agent,即刻体验 OpenAI Realtime API
  2. 开源实时多模态 AI 框架 TEN Framework
  3. 嘉宾 Cage 共同撰写文章:《Voice Agent:AI 时代的交互界面,下一代 SaaS 入口
  4. 特德·姜在《纽约客》的文章: Why A.I. Isn’t Going to Make Art

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群