内容持续更新中
2025年1月20日,豆包 App 正式发布了其最新的 “端到端” 语音大模型,并对实时语音通话功能进行了重要更新。这一进展标志着豆包在语音交互领域的又一次飞跃,超越了之前的 ASR(自动语音识别)、…
出门问问多模态大模型又添新备案!近日,出门问问(02438.HK)语音大模型「序列猴子」成功通过上海市生成式人工智能服务备案,这是出门问问继「序列猴子」大模型完成相应备案后的又一次成就。 此次备案的顺…
从Google Glass到Vision Pro,人类对智能眼镜的探索有进展,但都不算成功,直至Ray-Ban Meta的出现,这才让行业对智能眼镜重燃信心,从去年开始,随着AI大模型应用的深入,智能…
近期,趣丸科技发布了名为MaskGCT的全新语音合成(TTS)模型,该模型在语音质量、相似度和可控性方面取得了显著突破,直接颠覆了传统语音合成(TTS)的玩法,让AI彻底摆脱了对人工标注的依赖,实现了…
新京报贝壳财经讯(记者白金蕾 陈维城)10月25日至26日,由RTE开发者社区和声网联合主办的RTE2024第十届实时互联网大会在京举行。会上一场由Lepton AI创始人兼首席执行官贾扬清,Mini…
两年前,ChatGPT爆火,掀起全球范围内的大模型开发热潮。国内大厂和创业公司纷纷入场,试图在AIGC时代占据一席之地。 如今,各家的产品都已铺开落地,和各行各业紧密结合。有数据显示,中国AI原生应用…
在这个信息爆炸的时代,一款名为"Open NotebookLM"的创新工具正在悄然改变我们获取知识的方式。这个被誉为Google NotebookLM开源替代品的应用,不仅能将枯燥…
Drew Thomasson 最近发布了一个创新的开源项目—— ebook2audiobookXTTS,该工具利用 Calibre 和 Coqui TTS,将电子书转换为高质量的有声读物,支…
“如果说生产力提效是游戏+AI 1.0时代,那么依托AIGC(人工智能生成内容)技术实现的游戏玩法革新则推动了游戏+AI进入2.0时代。”近日,巨人网络AI实验室负责人丁超凡在接受《每日经济新闻》记者…
证券时报e公司讯,9月19日,2024云栖大会在杭州开幕,巨人网络携多项“游戏+AI”新成果首次参展,两款自研大模型GiantGPT、BAILing-TTS应用首发,巨人摹境、AI数字人等AI新技术亮…
在人工智能快速发展的今天,一款名为Mini-Omni的开源多模态大型语言模型正在引领语音交互技术的革新。这个由多个先进技术集成而成的AI系统,不仅能够实现实时的语音输入和输出,还具备"边思考…
随着科技的不断进步,人工智能已经不仅仅是一个冷冰冰的机器,它正在变得越来越像我们人类。想象一下,当你的智能助手不仅能说一口流利的普通话,还能用你熟悉的家乡话与你交流,那将是一种多么亲切的体验。Bail…
近日,上交大LANCE实验室和字节跳动联手推出了一款名为LSLM的新型交互式语音模型。据称,这款模型可以边听边说,效果非常好,接近人类自然的对话方式。 LSLM被称为“小L”,解决了现有语音模型在实时…
近年来,数字阅读逐步成为主流,中国音像与数字出版协会报告显示,用户规模持续增长。AI技术与数字阅读的结合,不仅提升阅读效率,还改善阅读体验。
万兴科技旗下的国产AI剪辑软件Filmora正以智能化和简便操作吸引全球视频创作者。本文探讨了Filmora在AI音视频技术、全球市场拓展和创作者服务方面的发展,展示其在全球1亿用户中的影响力。
在人工智能的世界里,语言的界限正在被不断打破。ElevenLabs最新推出的Turbo2.5模型,以其卓越的性能和多语言支持,再次证明了这一点。 ElevenLabs的新款Turbo2.5模型,不仅支…
Fish Speech是一款由fishaudio开发的全新文本转语音工具,它不仅完美支持中文、英语和日语,而且在语音处理上的能力接近人类水平,可以说是你私人语音助手的不二之选。 要点: 😊 完美支持中…
6月12日,国家网信办公布了深兰硅基知识智能对话多模态大模型算法成功备案的消息,该算法在深度合成服务领域具有重要意义。文章详细介绍了该算法的备案过程、功能和应用场景,展示了其在不同产品上的成功应用。
来源:数智前线 中国电信在方言语音大模型上的布局,既有践行市场导向,提高生产力和服务水平的业务考量,也有作为央企的社会责任担当。 文|游勇 编|周路平 OpenAI不久前发布的GPT-4o大模型,再一…
3月20日,在2024全球游戏开发者大会(GDC)上,腾讯发布了自研游戏AI引擎GiiNEX。借助大模型等生成式AI技术,GiiNEX面向AI NPC、场景制作、内容生成等场景,提供了包括2D图像、动…
喜马拉雅以其创新的技术应用和内容生态,持续引领着音频行业的变革。其中,喜马拉雅CTO姜杰的贡献尤为突出,他带领团队在AIGC(AI生成虚拟内容)领域取得了显著进展,全面赋能音频内容创作,为行业带来了新…
2024年,生成式人工智能仍然是最引人注目的“科技焦点”。随着国内人工智能大模型的持续优化和升级,自然语言交互和多场景内容生成的能力不断提升。 科大讯飞(002230.SZ)去年在人工智能通用大模型及…
2023年以来,以ChatGPT为代表的生成式 AI(AIGC,Artificial Intelligence Generated Content)技术成为整个科技行业最热门的讨论话题。 AI 技术的…
这意味着人人可零代码制作智能体的时代已来临。然而,自制 GPT 工具也意味着此前不少想要抓住 AI 浪潮的爱好者们研发的智能客服、虚拟人直播 / 解说、服务机器人、智能助手以及想要填补 OpenAI …
高通首次在国内展示基于最新旗舰骁龙移动及PC平台,采用国内大模型在终端侧运行的生成式AI用例;使用英特尔酷睿处理器扩展英特尔独立显卡,在英特尔智能座舱平台大语言模型和生成式AI 模型,可本地体验车载中…
网络小说中常出现的穿越、玄幻、求真、修仙桥段都源于什么?9月23日,阅文集团公共事务副总裁王睿霆在南京举办的“2023文化和科技融合热点和趋势论坛”上,带来《数字赋能文化、创造阅读未来》的分享。 阅文…
4月21日,世界读书日前夕,AI超拟真有声书《智能交通》在喜马拉雅APP上线。这部音频作品基于百度董事长兼CEO李彦宏所作《智能交通》一书,使用李彦宏约300句公开语音数据,通过AIGC(AI自动生成…
只需输入文字脚本,就能迅速自动生产一条有“数字主持人”出镜口播的视频新闻?这是在9月末即将举行的百度万象大会上,百度百家号将推出的AIGC组合拳之一:数字主持人解决方案。 AIGC指的是“人工智能自动…