内容持续更新中
ElevenLabs 阅读器应用程序现已在 Android 上推出。这款应用程序不仅能朗读文章、PDF或ePub文件,而且提供了数百种高品质的AI语音选择,让阅读不再局限于视觉。 ElevenLabs…
最近,LensGo AI推出了新功能——FaceSync。FaceSync功能的核心在于其能够将用户的表演视频与所选择的图片或视频同步,创造出一种全新的视觉体验。用户可以录制自己的表演,然后挑选一张图…
近日,总部位于旧金山的人工智能初创公司 Luma AI 正式推出了其 Dream Machine 平台的新功能 “Loops”。 这个新功能允许用户通过文本描述、图片或关键帧创建无缝、连续的视频循环。…
微软最近放了个大招,推出了一款名为Microsoft Designer的设计应用程序,这可不是普通的设计软件,它用上了人工智能技术,让设计变得更加简单、高效。现在,无论是网页、Windows应用还是i…
在这个信息爆炸的时代,投资者们需要一个能够快速、准确地提供实时股票数据和新闻的工具。StockBot,一个由Lama3-70B驱动的聊天机器人,正是为了满足这一需求而生。 StockBot运行在Gro…
在人工智能的世界里,语言的界限正在被不断打破。ElevenLabs最新推出的Turbo2.5模型,以其卓越的性能和多语言支持,再次证明了这一点。 ElevenLabs的新款Turbo2.5模型,不仅支…
时隔数月,Domo AI终于有了点新动作。最近,Domo AI 的唇形同步功能有了些升级,相较之前,视频风格转绘唇形同步效果更加完美。 升级前后对比 今年5月,Domo AI正式推出唇形同步功能。这项…
最近,Haiper AI更新视频模型,现在用户可以生成8秒时长的视频了,而且还可以通过超分工具进一步提升视频分辨率。能够生成更长的视频意味着用户可以创作更加复杂和丰富的故事线,增加内容的吸引力。 虽然…
在当今快速发展的人工智能领域,小型语言模型(LLMs)正变得越来越重要。它们不仅能够在消费级硬件上高效运行,还能支持完全离线的应用场景。H2O.ai 团队自豪地推出了 H2O-Danube3,一系列小…
在数字创作的神奇世界里,想象一下,你能够轻松地将一张图片中的主题拖放到另一张风格迥异的背景图中,并且让这个主题完美地融入新环境,既保留了它的个性,又与新背景的风格无缝对接。这听起来像魔法,但这就是Ma…
在这个AI大爆炸的时代,大型语言模型(LLMs)已经成为推动机器学习应用的超级引擎。但是,训练这些庞然大物需要巨大的计算资源。想象一下,如果我们能在世界各地分散的设备上,高效地训练这些模型,那将会怎样…
在科技的江湖里,Google DeepMind又扔出了一个重磅炸弹——他们把一个叫Gemini1.5Pro的系统装到了机器人身上。这可不是普通的升级,这玩意儿让机器人有了记忆导航的超能力,简直就是给机…
最近,AI照片“复活术”,在网络上掀起了不小的波澜,Heygen终于也按耐不住,开始推对口型工具了。 你只需要上传一张照片和一段音频,照片中的人物就能根据音频内容开始说话、唱歌,甚至是朗读。而且,它目…
三星电子在可穿戴设备领域又迈出了创新的一步,这次他们带来的是全新的Galaxy Ring智能戒指,以及Galaxy Watch7和Galaxy Watch Ultra。这不仅是科技的一次飞跃,更是将G…
在无人车技术领域崭露头角的团队,如今跨足好莱坞,为大家带来一项革命性的电影级视觉AI特效——Odyssey。说白了,这团队是要用AI颠覆电影、电视节目和视频游戏的制作方式。 效果如何,直接看视频吧: …
最近,Mentee Robotics公司发布了一段关于其人形机器人MenteeBot的最新视频。这款机器人不仅能跟随人类在新环境中自由导航,还能灵巧地避开障碍物,并根据指令进行各种动作和姿态调整。 早…
加州大学圣地亚哥分校和麻省理工学院的研究员们搞了一个叫Open-TeleVision的项目,听起来有点酷炫。这个玩意儿是一种开源的远程操作系统,号称能让你从3000英里外轻松操控机器人,还能精准地玩弄…
LivePortrait,这个名字听起来就像是魔法,但它其实是现实世界中的黑科技。想象一下,你那尘封已久的相册里,那些定格在时间里的笑脸,突然间动了起来,眨眼、微笑、甚至说话,这不再是电影里的场景,L…
今天,ElevenLabs给我们带来了一个让音频爱好者们兴奋不已的新产品——VOICE ISOLATOR,一款能够"消音"的神奇工具。它不仅能消除不需要的背景噪音,还能从任何音频中…
MimicMotion最近推出了一项令人瞩目的新技术,名为“High-Quality Human Motion Video Generation with Confidence-aware Pose …
法国开源AI研究实验室Kyutai发布了一款全新的多模态大模型Moshi。这不仅仅是一个技术突破,更是对现有AI技术的一次大胆挑战。 7月4日凌晨,Kyutai在官网宣布了Moshi的到来。这款模型的…
近日,研究人员发布了一项名为 Meta3D Gen(3DGen)的全新、快速的文本生成3D 模型的技术,3D Gen 通过高效的方式创建3D 模型,具有高质量的纹理和材质,为用户带来了全新的体验。 这…
Fish Speech是一款由fishaudio开发的全新文本转语音工具,它不仅完美支持中文、英语和日语,而且在语音处理上的能力接近人类水平,可以说是你私人语音助手的不二之选。 要点: 😊 完美支持中…
快手公司旗下的视频生成大模型“可灵”近期推出了两项全新功能:“图生视频”和“视频续写”,进一步丰富了用户的视频创作工具箱。 “图生视频”功能允许用户上传任意图片,快速生成一段5秒的精彩视频。这一功能不…
环球音乐集团(UMG)与AI音乐技术公司SoundLabs强强联手,为歌手和艺术家们带来了一项革命性的技术——定制自己的语音克隆模型。这不是科幻,这是现实! 通过SoundLabs的MicDrop功能…