内容持续更新中
今年的CES和MWC大会展示了最新科技成果,5G网络使移动互联网使用场景爆炸式增长。5G Advanced提供更高速度、更低延迟和更大容量,与AI技术的深度融合进一步降低功耗,实现更高效的网络控制。A…
近日, 国内互联网巨头盛大集团旗下 Tanka AI 团队 在北美市场 高调 发声, 推出了一款 颠覆 传统 IM 认知的 创新 产品 。 这款名为 Tanka 的 IM 工具, 首次 将 AI 长期…
终于,所有人都可以用上字节的视频生成模型PixelDance了!现在,字节跳动视频生成模型PixelDance和Seaweed已经在即梦AI全量上线了,用户现可通过即梦 AI 网页版和手机端 APP,…
近日,Adobe 推出了一款名为 “Magic Fixup(魔法修复)”的人工智能照片编辑工具,宣称将彻底改变我们处理图片的方式。这个新技术能够自动进行复杂的图像调整,同时又能保留创作的艺术意图,这无…
Google DeepMind近期发布的Genie2,正以其惊人的世界生成能力,重新定义了AI训练和交互的可能性。 Genie2是一个革命性的基础世界模型,能够通过自然语言指令,实时生成高度多样化且逻…
科技创业公司Wonder Dynamics近日发布了一款颠覆性的AI工具Wonder Animation测试版,这家由好莱坞演员Tye Sheridan联合创立的公司,正在用人工智能重新定义影视制作流…
Open-Sora Plan又升级了!最新发布的Open-Sora Plan v1.2版本引入新的3D全注意力架构,提升了对物理世界的理解能力。 本次更新主要亮点: 全新3D全注意力架构:新架构让AI…
LivePortrait,这个名字听起来就像是魔法,但它其实是现实世界中的黑科技。想象一下,你那尘封已久的相册里,那些定格在时间里的笑脸,突然间动了起来,眨眼、微笑、甚至说话,这不再是电影里的场景,L…
环球音乐集团(UMG)与AI音乐技术公司SoundLabs强强联手,为歌手和艺术家们带来了一项革命性的技术——定制自己的语音克隆模型。这不是科幻,这是现实! 通过SoundLabs的MicDrop功能…
昨晚,AI音乐生成工具Udio带来了一系列令人瞩目的更新,这些更新在音质上实现了显著的提升。在这次更新中,Udio展示了其V1模型与最新V1.5模型之间的对比,突出了新版本在多个关键领域的进步。 V1…
近日,HeyGen 公司宣布将其数字人模型与 OpenAI 的 Sora 模型实现集成,引发业界广泛关注。这一技术突破意味着,我们即将迎来前所未有的、由人工智能驱动的“会说话的虚拟形象”视频。这些虚拟…
用一段简单的哼唱、一段节奏的敲击,就能让AI生成一段高品质的音乐或音效,这不再是幻想。一项名为Sketch2Sound的创新研究成果,展示了一种全新的AI模型,它可以通过声音模仿和文本提示来生成高质量…
最近,清华系的生数科技推出了一项令人兴奋的功能,任何人只需一张图片,就能轻松生成各种背景的视频,仿佛拥有了 “视频魔法”。 这项功能就是 “主体参照”功能,它的最大亮点在于,可以让视频中的任何主体 —…
近日,总部位于旧金山的人工智能初创公司 Luma AI 正式推出了其 Dream Machine 平台的新功能 “Loops”。 这个新功能允许用户通过文本描述、图片或关键帧创建无缝、连续的视频循环。…
说到图像高清放大,大家印象中做的比较好的一直是Magnific。而现在,Leonardo也推出了高清放大功能了,而且速度更快更便宜! 从X博主James Yeung分享的效果视频来看,Leonardo…
近日,字节跳动开发了一款名为PersonaTalk的AI模型,该模型可以为视频精准配音。 这项技术不仅能够实现声音与嘴型的完美同步,还能在生成新视频时保留人物的原始说话风格、面部特征和表情…
HeyGen最新推出的Avatar3.0系统正在重新定义AI虚拟形象的可能性,为视频创作带来前所未有的革命性变革。这次升级不再局限于简单的口型同步,而是将虚拟角色的表现力提升到了一个全新的境界。 Av…
Meta公司最新发布的大型语言模型Llama2因其未满足开源倡议要求而备受争议。AI研究负责人Joelle Pineau表示,开放性需要平衡信息共享的好处与业务潜在成本。Meta积极参与制定AI模型标…
诺贝尔奖得主 Demis Hassabis 近日接受英国《金融时报》采访,谈论了 AI 在科学研究中的作用和影响。他认为,AI 已经到达一个分水岭,人们认识到它实际上已经足够成熟,可以帮助科学发现。 …
人工智能视频生成工具Pixverse正式发布了其V4. 0 版本,这一更新被用户评价为“强的有点可怕”。根据X平台上的最新动态,Pixverse V4. 0 不仅对底层模型进行了大幅升级,还新增了同步…
在当今快速发展的人工智能领域,小型语言模型(LLMs)正变得越来越重要。它们不仅能够在消费级硬件上高效运行,还能支持完全离线的应用场景。H2O.ai 团队自豪地推出了 H2O-Danube3,一系列小…
阿里国际站总裁张阔在会上透露,AI外贸产品推出小半年,已有1.2万家外贸企业订购使用,AI发布的商品已经达到百万规模,通过AI优化这些产品在海外的搜索量提升达到37%。张阔认为,随着科技的发展,生成式…
在人机对话的世界里,最让人头疼的莫过于——“你到底说完没”! 这句话看似简单,却成了无数语音助手和客服机器人迈不过去的一道坎儿。 你是不是也经常遇到这种情况:你只是停顿了一下,想思考接下来要说什么,结…
在数字内容创作的快速发展中,Pika Labs 推出了新功能 ——Pikadditions,让用户可以轻松地将任何对象或角色无缝地添加到现有视频中,将普通的视频片段转变为引人入胜的视觉叙事。 Pika…
最近,LensGo AI推出了新功能——FaceSync。FaceSync功能的核心在于其能够将用户的表演视频与所选择的图片或视频同步,创造出一种全新的视觉体验。用户可以录制自己的表演,然后挑选一张图…
近日,人工智能公司 Rhymes AI 正式开源其先进的文本生成视频模型 Allegro。Allegro 允许用户将简单的文字描述转换为高质量的短视频片段,为人工智能生成视频领域的创作者、开发者和研究…
OpenAI正在考虑自研AI芯片,以摆脱英伟达和微软的依赖。这被视为OpenAI进一步独立的信号。除了降低硬件成本,自研芯片也将有助于OpenAI未来制造消费级AI产品,实现在AI时代类似PC时代Wi…
OpenAI 近日宣布,将其 ChatGPT 高级语音模式扩展到欧盟、瑞士、冰岛、挪威和列支敦士登等地区。该功能允许 ChatGPT 在232毫秒(平均320毫秒)内响应音频输入,可与人类在典型对话中…