空间计算、物理计算、实时仿真与创造拥有「自主行为」的小狗

虚拟世界与现实世界的界限逐渐模糊,已然成为不争的事实。但究竟哪些曾经的幻想已然照进现实,又有哪些挑战依然横亘眼前?本期节目,我们邀请三位来自不同领域的嘉宾,从 2024 年底的当下出发,共同审视虚拟与现实融合的真实图景。

InSpaze 的易明分享了在全新的硬件生态 Vision Pro 上开发社交应用的挑战与机遇,并展望了虚拟社交的未来;
Motphys 的崔汉青深入剖析了实时物理引擎如何赋予虚拟世界更真实的物理规律,以及在游戏、具身智能、数字孪生领域的应用;
MicroBlocks 的邵悦展示了物理计算平台 MicroBlocks 的特点和优势,如何简化硬件开发流程,让人人都可以通过编程改变现实世界。

虚实交错和跳跃之间,三位嘉宾将关注点聚焦于一个挑战:如何结合虚拟和现实、软件和硬件,以及 AI 技术,创造一只能够陪伴人类的机器狗?

本期播客录制于 RTE 2024 大会期间的「《编码人声》线下开放麦」,这是开放麦特辑的第 2 期。

本期嘉宾和主播

易明:InSpaze 创始人,Vision Pro 社交应用开发者,被 Vision Pro 「压」出苹果肌
崔汉青:Motphys 创始人,实时动作物理引擎开发者
邵悦:MicroBlocks 社区推广人,想让硬件开发像搭积木一样简单
朱峰:「津津乐道播客网络」创始人,产品及技术专家。

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

能操控电脑的 Computer Use 究竟是什么?万能胶水、旧世界操作员,还是无所不在的智能?

无论你是否熟悉 Function Call、Tool Use 或者 RPA,都可能刷到了 Claude 推出「能像人一样操控电脑」的 Computer Use 的新闻。

与 Claude 3.5 Sonnet 一同发布的 Computer Use,可模拟人与计算机的交互,执行如移动光标、点击按钮、输入信息等操作。

本期节目,我们请到了 Riffo 的陈春宇和 LLamaEdge 的 Michael Yuan。Riffo 能在桌面调用 LLM 能力,实现文件智能重命名和整理;而 LLamaEdge 则是一个轻型、本地化的 LLM Runtime。本期的主播白宦成也长期从事企业 AI 自动化产品设计。

三个开发者在 Computer Use 发布前,就长期从事 AI 自动化设计或端侧 AI 能力的探索。他们如何看待这一次 Claude 的新品发布? Computer Use 究竟是什么?又该如何「use」?期待这期节目对你有所启发。

本期播客录制于 RTE 2024 大会期间的「《编码人声》线下开放麦」,这是开放麦特辑的第一期。

本期嘉宾和主播

Michael Yuan,WasmEdge 维护者&Second State 创始人。
陈春宇,cofounder & CEO of GroupUltra,探索人与信息的互动。
白宦成,全流程工程师,AI 产品经理,RTE 开发者社区布道师,《编码人声》主播。

相关信息

RPA,即「机器人流程自动化」(Robotic process automation),是以软件机器人及人工智能为基础的业务流程自动化技术。
OpenAI Function callingClaude Computer use
嘉宾 Micheal Yuan 正在维护两个项目:WasmEdgeLLamaEdge
嘉宾陈春宇的项目:Riffo
嘉宾陈春宇用于搭建 AI 搜索服务的配置:Tavily+Jina

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

下一代 AI 陪伴 | 平等关系、长久记忆与情境共享

这期对话都来自 AI 陪伴产品开发者最真诚的思考和感悟。

嘉宾们探讨了「真正的 AI 陪伴」应具备的核心元素——平等关系、长久记忆、情境共享和持久对话等。这些元素都指向下一代 AI 陪伴的技术或产品方向。

嘉宾碎瓜曾开发了一款「虚拟恋人」产品,但因不愿看到 AI 成为不平等关系的附属而关闭了它。

另一位嘉宾付则宇花了数月实现了 GPT-4o 的语音对话能力,最后感叹:「复刻 4o 后才发现,这才是语音 AI 的开始。」

理解自己,是理解社交产品最漫长却最有价值的一条道路。希望本期嘉宾一些向内的思考,能让听众所启发。

本期嘉宾和主播

  • 碎瓜,前算法工程师、现在是个人开发者。
  • 付则宇,数字人格创始人。
  • Cynthia 杨慧,实时互动从业者,RTE 开发者社区发起人,声网生态运营中心负责人,《编码人声》主播。

听友福利

RTE 大会 2024 限免门票:10 月 25 日到 26 日,RTE 开发者社区联合声网策划的 RTE 大会 2024 将在北京举行。今年的技术论坛将覆盖音视频技术、AI 生成视频、Voice AI、多模态大模型、空间计算和新硬件、云边端架构和 AI Infra 等话题。期待与你一起探索实时互动的更多可能,咱们 10 月 25 日到 26 日,北京见!

获取《编码人声》听众限免门票: https://r.daofm.cn/9fgol

相关内容

节目里提到的碎瓜作品:

  1. 分歧终端机,让 7 个 AI 给你们的吵架评评理
  2. TurtleBench,基于 AI 海龟汤游戏数据的大模型推理能力 benchmark

碎瓜:《一个失败的 AI 女友产品,以及我的教训:来自一位中国开发者的总结》

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

很好也很贵?OpenAI Realtime API 一手体验和 Voice AI 的未来

OpenAI Realtime API 发布了,你准备好了么?

Realtime API 让开发者可以构建近乎实时的「语音到语音」的体验,无需将多个模型拼接在一起进行转录、推理和文本到语音的转换,实现更流畅的打断体验,还可以无缝切换多种语言。

本期节目请来了第一批接入并体验 OpenAI Realtime API 的开发者,为你解析背后的技术和开发者的新机会。

两位嘉宾分别是在实时多模态 AI 领域深耕多年的专家——开源实时多模态 AI 框架 TEN Framework 的联合发起人 Plutoless ,以及拾象科技的 AI Research Lead 钟凯祺 Cage。

节目深度分析了 OpenAI Realtime API 的优势与挑战,讨论了实时多模态 AI 如何实现语音进、语音出的端到端交互,大幅降低延迟,提升用户体验,使得与 AI 的对话更加自然流畅。也谈到了目前存在的高昂成本和技术集成的复杂性,以及这些问题对开发者意味着什么。

此外,嘉宾们还深入探讨了实时多模态 AI 的定义,什么才是真正的实时多模态?他们分享了自己在实践中遇到的挑战和最佳实践,探讨了在 OpenAI Realtime API 的背景下,开发者如何抓住新的机遇。他们也展望了 AI 在未来实时互联网中的角色,讨论了 AI 安全、人与 AI 的协作、多模态交互等话题。

节目中提到的 Voice Agent 象限图:X 轴为「准确优先」到「创造力优先」,Y 轴为「实时不敏感」到「实时敏感」(「海外独角兽」制图):

本期嘉宾和主播

  • 普列思(Plutoless), 开源多模态实时互动框架 TEN Framework 的联合发起人和开发者体验负责人,RTE 开发者社区布道师。拥有多年在实时互动领域的专业从业经验。
  • 钟凯祺 Cage,「海外独角兽」AI Research Lead。
  • 朱峰,「津津乐道播客网络」创始人,产品及技术专家。

听友福利

10 月 25 日到 26 日,RTE 开发者社区联合声网策划的 RTE 大会 2024 将在北京举行。今年的技术论坛将覆盖音视频技术、AI 生成视频、Voice AI、多模态大模型、空间计算和新硬件、云边端架构和 AI Infra 等话题。期待与你一起探索实时互动的更多可能,咱们 10 月 25 日到 26 日,北京见!

获取《编码人声》听众限免门票: https://r.daofm.cn/9fgol

同期 AI Workshop 报名:「组装」你的专属多模态 Agent!(10 月 26 日下午,北京)https://www.bagevent.com/event/rteworkshop

相关内容

  1. 访问 TEN Agent,即刻体验 OpenAI Realtime API
  2. 开源实时多模态 AI 框架 TEN Framework
  3. 嘉宾 Cage 共同撰写文章:《Voice Agent:AI 时代的交互界面,下一代 SaaS 入口
  4. 特德·姜在《纽约客》的文章: Why A.I. Isn’t Going to Make Art

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

当一个 35+ 的硬核技术人决定去卖货

NAS+AI,虽然王勇不太愿意接受这样的标签,但「懒猫微服」确实凭借这一产品认知在中文推特上获得了关注。

还是标签——这期播客标题看上去满是触发人焦虑的标签,甚至对谈内容都难免带一些人生经验的「说教」。但仔细聆听,你会发现嘉宾王勇的每一句话更像是在和过去的自己对话:「你是想比一把今朝谁能 GitHub 榜一,还是想比谁能坚持做开源五十年?」

王勇是国内 Emacs 社区最资深的开发者之一,共开发了 400 多个插件(独立插件包 30 多个)。

他也是 deepin 的前 CTO,见证了一个开源操作系统从几人团队到百万日活,从无人理解到被广泛使用。

当一个技术人开始学习做产品和销售,白天服务用户,夜里才沉浸个人技术世界。他是如何调整观念,做到知行合一?

端侧的边缘微型 AI 服务器,又承载了一个资深操作系统开发者的什么想法?为了让每个开发者都可以「开一家自己的『小面馆』」,王勇和团队都做了哪些产品和技术的思考?

本期对话充满了抵抗和妥协,执着与谅解。让我们追随一个硬核技术人,持续发问世界和自己,探索编码和人生。

【本期主播与嘉宾】

  • 王勇 aka 懒猫:Linux,Emacs 开源社区从业二十余载,懒猫微服 CEO。
  • 朱峰:「津津乐道播客网络」创始人,产品及技术专家。

相关内容

一些改变王勇的书籍或节目:

留言抽取优惠码:懒猫微服团队也在支持开发者持续发问世界和自己,评论区留言最近你在思考的问题,或者在做的项目,随机送出 5 份懒猫微服购买优惠码(价值 1024 元)。了解懒猫微服:https://lazycat.cloud

听友福利

RTE 大会 2024 限免门票:10 月 25 日到 26 日,RTE 开发者社区策划的 RTE 大会 2024 将在北京举行。今年的技术论坛将覆盖音视频技术、AI 生成视频、Voice AI、多模态大模型、空间计算和新硬件、云边端架构和 AI Infra 等话题。期待与你一起探索实时互动的更多可能,咱们 10 月 25 日到 26 日,北京见!获取《编码人声》听众限免门票:https://r.daofm.cn/2024

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

AI+AR 迎来「百镜大战」,智能眼镜距离「下一代计算平台」还有多远?

随着出货量突破 100 万台的 Ray-Ban Meta 智能眼镜的成功,加上愈加成熟的语音 AI 和视觉理解能力的加持,国内外各大厂和创业公司纷纷进场智能眼镜,「百镜大战」一触即发。

本期节目,嘉宾将从 AR 眼镜从业者、AI Agent 构建者和空间计算开发者的不同视角,分享实践中看到的新机会。

有嘉宾认为,软硬结合的垂类 AR 眼镜解决的是手机无法满足的场景,解决问题就能让用户用钱投票。随着上下游生态链的成熟,现在正是轻型 AR 眼镜创业的黄金时代。

智能眼镜还推动了开发者对下一代人机交互界面 LUI(语言用户界面)的探索,端侧模型能力和与低延迟的实时 AI 互动也会变得更加重要。

智能眼镜距离成为下一代计算平台还有多远?云端结合的计算的未来会是什么样子?开发者该如何面对「每天醒来就是一个新弯道」的世界?

本期嘉宾各抒己见,但至少达成了一个共识:一款的好的智能眼镜,首先是一副好的眼镜。

【本期节目你将听到以下内容】

00:00:00 AR眼镜的复兴
00:08:19 AI技术的进展正在推动AR眼镜等设备的创新
00:16:53 雷朋与Meta合作的智能眼镜为什么火了?
00:25:24 智能眼镜的未来依赖于技术成熟度与用户体验的平衡
00:33:03 AR的发展需关注用户需求,技术应服务于实际应用
00:41:11 智能设备与AI结合的趋势
00:50:03 AR眼镜的未来发展依赖于独立算力,用户对新设备的接受度受到旧设备替代成本的影响
01:07:05 开发者应关注哪些技术角度来促进场景创新?

【本期主播与嘉宾】

  • 朱庆峰,AR 眼镜创业者。前北京驭光科技研发总监,创建和领导驭光科技 3D 传感、AR 显示和智能眼镜产品线。清华大学精密仪器系学士及硕士学位、英国赫瑞-瓦特大学(Heriot-Watt University)管理学硕士学位。
  • Plutoless, 开源多模态实时互动框架 TEN Framework 的联合发起人和开发者体验负责人,RTE 开发者社区布道师。拥有多年在实时互动领域的专业从业经验。
  • 狼叔:Node.js 技术布道者,Node 全栈公众号运营者,曾就职于去哪儿、新浪、网秦,做过前端、后端、数据分析,是一名全栈技术的实践者。已出版《狼书(卷 1) :更了不起的 Node.js》《狼书(卷 2) :Node.js Web 应用开发》《狼书(卷 3) Node.js 高级技术》。
  • 朱峰:「津津乐道播客网络」创始人,产品及技术专家。

相关内容

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

真去送了外卖的程序员,来聊聊他眼中的《逆行人生》

我们请来一位真的去体验了送外卖的程序员,请他聊聊他眼中的《逆行人生》。

本期节目,我们会围绕这部电影的真实性和一些不符合实际的桥段聊起,跟大家分享这些外卖小哥的真实体验,更重要的,我们的嘉宾想跟大家分享下,一旦从“办公室精英”转变为到体力劳动者,有怎么样不同的体验。

这部电影上映以来,基本上是两头不讨好的状态:“精英”说在歌颂苦难,“劳动人民”在说消费苦难。而我们想说的是,在当下,如果我们想要一些社会议题被更多人关注,难道还有什么更好的办法么?

本期主播及嘉宾

  • 朱峰:「津津乐道播客网络」创始人,产品及技术专家。(微博:@zhufengme)
  • 高春辉:「科技乱炖」主播。“中国互联网站长第一人”,科技、互联网领域的连续创业者。(微博:@高春辉,微信公众号:老高的互联网杂谈)
  • 德福:「不太保险」主播,斜杠开发者。

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

对谈MoonBit,AI时代的编程语言应该是什么样子的?

本期节目,我们请到了MoonBit的创始人宏波和资深的开发者狼叔作为我们的嘉宾,一起和大家聊聊关于AI时代的编程语言应该具备的特点和发展方向。

今天,除了讨论尝试利用AI来“帮助”我们写代码之外,我们更希望探讨在AI时代的编程范式是否会发生一些变化。例如,是否会从降低写代码时的输入量,转变为更容易让LLMs理解的结构等方面进行探讨。

本期主播及嘉宾

  • 狼叔:Node.js 技术布道者,Node 全栈公众号运营者,曾就职于去哪儿、新浪、网秦,做过前端、后端、数据分析,是一名全栈技术的实践者。已出版《狼书(卷 1) :更了不起的 Node.js》《狼书(卷 2) :Node.js Web 应用开发》《狼书(卷 3) Node.js 高级技术》。
  • 张宏波:IDEA 研究院基础软件中心首席科学家、MoonBit 平台负责人。
  • 朱峰:「津津乐道播客网络」创始人,产品及技术专家。

相关资料

MoonBit 是一个用于云计算和边缘计算的 WebAssembly 端到端的编程语言工具链。 您可以访问 https://try.moonbitlang.cn 获得 IDE 环境,无需安装任何软件,也不依赖任何服务器。

MoonBit 官网

制作团队

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

GPT-4o 只是对话式 AI 的冰山一角,背后隐藏了哪些新机会?

GPT-4o 只是「对话式 AI 」(conversational AI) 的冰山一角。

同期发布的 Project Astra 还演示了对话式 AI 和可穿戴硬件结合的可能。

更早些,hume.ai 上线了能解读 53 种不同情绪的「共情语音接口」(EVI),发布了一档实时交互式 AI 播客。

ChatTTS 让更多人体验到会笑会停顿,几乎与真人无异的语音合成技术。

投资机构 a16z 近期发布报告,创立了「Voice AI Agent」的投资新赛道并高呼:「是时候重新发明通话了!」

技术上实现 《Her》 的「最后一步」是什么?创业者如何利用现有技术能力满足用户?哪些场景最可能诞生真实付费需求?

本期节目,嘉宾将从模型开发者、实时互动从业者、AI 陪伴玩具创业者的不同视角,探讨「对话式 AI」的边界,分享实践中看到的新机会。

有嘉宾说:人工智能实现 human like 的最后一步,是允许 AI 与人类拥有平等地位:如果你希望 AI 像人,那就请允许 AI 可以随时地回应你也打断你,聆听你也忽略你……

如果是这样,你愿意吗?

【本期主播与嘉宾】

张栋,SpeechGPT 作者,SpeechGPT 是一个端到端的语音模型。

王乐,Folotoy 创始人,AI 陪伴对话玩具创业者。

李忻玮,声网 AI 算法工程师,《从零开始学扩散模型》作者,Hugging Face 中文社区成员。

白宦成,全流程工程师,AI 产品经理,RTE 开发者社区布道师,《编码人声》主播。

【听友福利】

欢迎在评论区留言,分享你对 GPT-4o 的看法,或者对最有潜力的对话式 AI 场景的预测。我们将抽出一位送出魔性的 Folotoy 仙人掌 AI 玩具一份(价值 398 元)。

【相关信息】

一起探索人和 AI 的新连接方式!RTE 开发者社区将在 6 月 22 日、23 日,联合 Founder Park 在北京举办线下的 AGI Playground 活动,边玩边探索 AGI 和 RTE 实时互动的新可能。加入社区微信群,还可以提前获取活动消息,抽免费活动门票。关注「RTE 开发者社区」微信公众号,在后台回复「小助手」即可入群。

【制作团队】

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群

在 GPT-4o 释放完整能力前,听听实时多模态 AI 创业者的一手经验

5 月中旬 GPT-4o 的发布,让人与 AI 的交互,从对话框的文本交流加速推进到了音视频多模态的实时互动。

本期节目,我们邀请到实时互动 AI 创业者史业民。他结合了自己的一手研发经验,深度分析了 GPT-4o 在多模态、实时交互、情感语音的新能力和能力边界,分享了 GPT-4o 正在催生的潜在场景和新机会。史业民还从开发者视角,提出了面向开发者的 GPT-4o 和面向用户的 ChatGPT 能力可能存在区别的提醒,以及在开发多模态 AI 产品时需要注意到的技术细节。

从对话框到音视频,多模态的实时互动 AI 已成趋势。希望本期节目能对你有所启发。

【本期主播与嘉宾】

  • 史业民:实时互动 AI 创业者,前智源研究院研究员。
  • 朱峰:「津津乐道播客网络」创始人,产品及技术专家。

【相关信息】

  1. 史业民团队最新项目:Pandora,一个可通过语言交互控制的生成视频世界模型。
  2. 一起探索人和 AI 的新连接方式!RTE 开发者社区将在 6 月 22 日、23 日,联合 Founder Park 在北京举办线下的 AGI Playground 活动,边玩边探索 AGI 和 RTE 实时互动的新可能。加入社区微信群,还可以提前获取活动消息,抽免费活动门票。关注「RTE 开发者社区」微信公众号,在后台回复「小助手」即可入群。

【制作团队】

后期 / 卷圈
监制 / 姝琦
产品统筹 / bobo
联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。
录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——
· 零一万物 01.AI 开源负责人 @林旅强 Richard
· FreeSWITCH 中文社区创始人 @杜金房
· 小红书音视频架构负责人 @陈靖

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

RTE 开发者社区 | 公众号:RTE开发者社区 | 津津乐道播客官网 | 版权声明 | 评论须知 | 加入听友群