分类目录介绍:
精选最新、最前沿的行业视频,深入探索AI技术在各领域的最新应用与未来发展趋势。内容涵盖核心技术、市场机遇,为行业决策者、研究人员和技术爱好者提供一手研究资料与行业洞察。
内容持续更新中
视频生成领域迎来重大突破!Genmo 公司重磅开源了其最新的视频生成模型 Mochi1,为视频生成领域树立了新的标杆。Mochi1采用创新的 Asymmetric Diffusion Transfor…
OpenAI 近日宣布,将其 ChatGPT 高级语音模式扩展到欧盟、瑞士、冰岛、挪威和列支敦士登等地区。该功能允许 ChatGPT 在232毫秒(平均320毫秒)内响应音频输入,可与人类在典型对话中…
近日,一款名为PodCastLM的工具正式推出,旨在帮助用户将PDF文档内容转换为适合音频播客的自然对话,并输出为MP3文件。该项目受NotebookLM工具的启发,通过处理文档内容,用户可以轻松生成…
Anthropic 震撼发布升级版 Claude3.5Sonnet 和全新模型 Claude3.5Haiku,两款模型均在推理、编码和视觉处理方面取得了显著进步。Claude3.5Sonnet 进行了…
知名 AI 视觉内容创作平台 Haiper 宣布推出 Haiper2.0版本,距离该模型首次发布仅七个月。此次重大升级承诺以更快的速度生成超逼真视频,与 OpenAI 的 Sora 不同,Haiper…
近日,人工智能公司 Rhymes AI 正式开源其先进的文本生成视频模型 Allegro。Allegro 允许用户将简单的文字描述转换为高质量的短视频片段,为人工智能生成视频领域的创作者、开发者和研究…
ComfyUI 近日发布 V1版本更新,带来一系列重大改进,包括全新桌面版应用、用户界面革新以及自定义节点安全机制升级等。 ComfyUI 此次发布的桌面版应用旨在为用户提供更流畅便捷的使用体验。桌面…
在数字化时代,招聘工作往往被海量简历的筛选所困扰。现在,一款名为Applicant AI的人工智能申请人跟踪系统(ATS)为这一问题提供了解决方案。由Web3Jobs和Remote OK联合开发,这款…
Applicant AI是一款由Web3Jobs和Remote OK开发的基于AI的申请人跟踪系统(ATS),旨在提高招聘效率。该系统通过AI技术,加速了招聘流程,提高了申请筛选的准确性和效率。 Ap…
Viggle AI 最近推出了一项令人兴奋的新功能,它不仅能让你的角色通过录制的声音说话,还能实现口型同步。这项创新技术让用户能够完全控制角色的表现方式,无论是唱歌还是跳舞,都能轻松实现。 这款名为 …
复旦大学和百度公司的研究人员联合开发了一种名为 Hallo2的全新 AI 模型,该模型可以生成长达数小时的4K 分辨率人物动画,并且可以通过语音和文字提示进行精准控制。 一直以来,生成高质量的人物动画…
近日,武蔵野大学数据科学学院的研究人员开发了一种名为 AMT-APC 的全新算法,可以更加精准地自动生成钢琴曲。这项技术利用了自动音乐转录 (AMT) 模型的优势,通过对其进行微调,使其能够更好地捕捉…
特斯拉再次刷新了人形机器人的发展进程。最新发布的Optimus机器人展示了一系列令人瞩目的新功能,从自主导航到与人类互动,无不彰显着人工智能和机器人技术的飞速进步。 这款机器人最引人注目的特性之一是其…
Cove近日宣布完成600万美元种子轮融资,投资方包括Sequoia Capital、知名投资人Elad Gil、Homebrew等。这家由前Google Maps核心团队成员创立的AI初创公司,正致…
在视频通讯日益普及的今天,一家名为Sieve的AI初创公司带来了一项可能改变视频互动方式的创新技术。该公司最新推出的API声称能够通过一次简单的调用,实现视频中眼神接触的自动修复,这一突破性进展有望为…
日常生活中,你是不是拍了不少“神图”,但苦于没有合适的音乐给你的神图加分。现在,你可以很轻松地给你的神图加点料了。 Suno推出的新功能“Suno Scenes”,可以满足大家的需求。该功能支持用户上…
TANGO,一个接近HeyGen的强大解决方案。这个创新项目不仅支持面部和唇形同步,更令人惊叹的是,它能够生成与音频完美匹配的全身动作视频。 TANGO的核心优势在于其独特的生成逻辑。首先,系统会分析…
加拿大卡尔加里大学的研究人员开发了一款名为“Augmented Physics”的全新工具,旨在将静态的物理课本图表转化为交互式模拟,为物理教育带来革新。 该工具利用先进的计算机视觉技术,如 Segm…
在后期制作领域,Adobe 一直是个大佬。最近,他们在 Adobe MAX 大会上正式推出了令人惊叹的 Firefly AI 视频功能。 这项技术让视频中的任何缺失部分都能通过简单的拖拽来解决,效果堪…
加州神经技术初创公司REMspace日前宣布了一项令人瞩目的科研成果。他们声称首次实现了与睡梦中的人进行双向交流,这一突破性进展可能为未来的梦境研究和应用开辟新的领域。 根据REMspace的研究,参…
近日,卡内基梅隆大学的研究团队发布了一项名为 “DressRecon” 的新技术,旨在通过单目视频重建时间一致的人体模型。DressRecon的厉害之处在于,不仅输入视频就能实现构建出3D模型,并它还…
在如今的数字时代,播客越来越受到大家的喜爱,尤其是随着多语言交流需求的增加,如何制作引人入胜的音频内容成了一个热门话题。 谷歌旗下的NotebookLM就备受好评,而最近一款名为 Podcastfy …
在图像处理技术日新月异的今天,一项名为PMRF(后验均值修正流)的创新算法正在引起业界广泛关注。这项技术巧妙地解决了图像恢复过程中长期存在的失真与感知质量之间的矛盾,为高质量图像重建开辟了新的可能性。…
人工智能正以惊人的速度颠覆各个行业,视频制作领域也不例外。近期,AI视频生成模型的出现引发了广泛关注,甚至有人声称它将彻底改变好莱坞的未来。 然而,这项技术的实际能力究竟如何?香港中文大学和腾讯的研究…
最近,斯坦福大学和麻省理工学院的研究人员共同开发了一种名为 WonderWorld 的 AI 系统,它能够从单张图片实时生成3D 场景。这项新技术使用户可以逐步构建和探索虚拟环境,轻松控制生成场景的内…
近日,Hailuo AI推出了其图片生成视频功能,这一创新性工具为视频制作带来了前所未有的便捷和灵活性。 这项新功能的核心亮点在于其文本与图片联合输入能力。用户只需同时提供文字描述和参考图片,Hail…
近日,一则关于哈佛大学两名学生开发AI眼镜的消息引发广泛关注。这款眼镜号称只需看一眼就能获取目标人物的所有个人信息,展示了人工智能在信息获取方面的惊人能力,同时也引发了人们对隐私安全的担忧。 这副经过…
最近,动物、建筑等膨胀飞上天的视频在社交网络疯传,不管是不是人的,都被压扁、融化、膨胀,一顿操作。由于这类效果比较搞笑,很快就在网络上引发了病毒式传播。 而这些有趣的效果,都是用Pika最近推出的1….