内容持续更新中
在2024年国际音乐信息检索会议(ISMIR)上,研究人员展示了他们最新研发的MusiConGen模型。这一模型是基于Transformer的文本生成音乐模型,通过引入时间条件机制,显著提升了对音乐节…
ElevenLabs 阅读器应用程序现已在 Android 上推出。这款应用程序不仅能朗读文章、PDF或ePub文件,而且提供了数百种高品质的AI语音选择,让阅读不再局限于视觉。 ElevenLabs…
在追求高效与人性化管理的今天,日本的一家大型连锁超市——永旺,却因使用AI技术监控员工微笑而引发了社会的广泛争议。 7月16日,雅虎日本报道称,永旺自7月1日起在240家门店推出了名为“Smile-K…
埃隆·马斯克(Elon Musk)最近在接受心理学家及作家乔丹·彼得森(Jordan Peterson)采访时宣布,xAI公司将于下个月发布其最新的人工智能模型Grok2。 马斯克表示,Grok2的性…
近日,小红书官方宣布上线了一个有趣的前沿科技账号“科技薯”,并带来了它的创业项目:全球第一家AI便利店。 根据官方介绍,「AI便利店」是科技薯联合全网优质作者、知名科技公司,导找世界上最真诚好看的AI…
最近,微软研究院与北京航空航天大学的研究团队联合推出了一个名为 E5-V 的全新框架,旨在为多模态嵌入提供一种更高效的解决方案。随着人工智能的不断进步,多模态大语言模型(MLLMs)已经成为研究的热点…
最近,LensGo AI推出了新功能——FaceSync。FaceSync功能的核心在于其能够将用户的表演视频与所选择的图片或视频同步,创造出一种全新的视觉体验。用户可以录制自己的表演,然后挑选一张图…
英伟达公司(Nvidia, NVDA)周一早盘股价大幅上涨,成为市场关注的焦点。这一涨幅的背后,主要是由于公司宣布其即将推出的新款Blackwell芯片的中国市场版本已符合美国的出口管制要求。在经历了…
Llama3.1泄露了!你没听错,这个拥有4050亿参数的开源模型,已经在Reddit上引起了轩然大波。这可能是迄今为止最接近GPT-4o的开源模型,甚至在某些方面超越了它。 Llama3.1是由Me…
近日,总部位于旧金山的人工智能初创公司 Luma AI 正式推出了其 Dream Machine 平台的新功能 “Loops”。 这个新功能允许用户通过文本描述、图片或关键帧创建无缝、连续的视频循环。…
最近,Stability AI 团队推出了一款全新的开源音频生成模型,名为 Stable Audio Open。这款模型的特别之处在于,它能够从文本提示生成时长可达47秒的立体声音频,采样率高达44….
最近,马斯克在社交平台 X(前身为推特)上宣布,他的公司 xAI 正在全球最强大的 AI 训练集群 —— 位于田纳西州孟菲斯的 “孟菲斯超级集群” 上进行训练。这一集群将会是该市历史上最大的一项资本投…
最近,Cohere 这个以 AIGC 为主的知名大语言模型平台引起了大家的关注。彭博社报道,Cohere 成功获得了5.5亿美元的 D 轮融资,公司的估值也达到了55亿美元。 这轮融资的领投方是加拿大…
巴黎奥运会临近,谷歌的Gemini AI技术将在巴黎奥运会上首次亮相,与NBCUniversal和美国奥林匹克与残奥委员会(USOPC)合作,将AI技术融入赛事转播中。谷歌不仅提供AI解说,还成为美国…
最近,Arcee AI 正式推出了其最新的开源语言模型 ——Arcee-Nova。这一新模型基于 Qwen2-72B-Instruct,迅速在开源领域中崭露头角,成为表现最优异的模型之一。经过评估,A…
微软最近放了个大招,推出了一款名为Microsoft Designer的设计应用程序,这可不是普通的设计软件,它用上了人工智能技术,让设计变得更加简单、高效。现在,无论是网页、Windows应用还是i…
在这个信息爆炸的时代,投资者们需要一个能够快速、准确地提供实时股票数据和新闻的工具。StockBot,一个由Lama3-70B驱动的聊天机器人,正是为了满足这一需求而生。 StockBot运行在Gro…
最近,苹果公司开源了DCLM-Baseline-7B模型,这个举动无疑将为AI语言模型的发展带来深远的影响。 DCLM-Baseline-7B模型的开源,不仅仅是代码的公开,更重要的是,它包括了从预训…
微软研究人员近期发布了一项名为SpreadsheetLLM的创新研究,旨在解决大语言模型(LLM)在解析电子表格时遇到的难题。 根据7月12日发表在Arxiv上的论文,SpreadsheetLLM通过…
谷歌定于8月13日上午10点(太平洋时间)举行其下一场大型硬件活动。这比通常在秋季中期举行的“Made By Google”活动提前了大约两个月。值得注意的是,谷歌此次将宣布其最新旗舰产品Pixel9…
日本连锁超市AEON最近引入了一种新技术——AI微笑监测系统,以提高员工的服务质量。这款名为“Mr Smile”的系统由日本科技公司InstaVR开发,能通过分析员工的面部表情、语音音量和语调等450…
随着OpenAI推出新一代的GPT大语言模型GPT-4o Mini,首席执行官山姆·奥特曼(Sam Altman)终于承认了其产品命名方式存在的问题。此次发布的GPT-4o Mini被宣传为比非Min…
如何将杂乱无章的数据变成有用的信息变得越来越重要。最近,Neo4j推出了一款全新的工具——Neo4j LLM知识图谱构建器,这款工具可以轻松将非结构化数据转化为结构化的知识图谱,让数据处理变得更高效。…
在视频制作和图像处理领域,视频的“去闪”技术一直是提升视频质量的关键。随着技术的发展,一种名为BlazeBVD的新型去闪算法应运而生,它不仅能够快速去除视频中的闪烁现象,还能保持视频内容的完整性和色彩…
最近,苹果公司的人工智能团队和华盛顿大学等多家机构合作,推出一款名叫 DCLM的开源语言模型。这款模型的参数达7亿,并且在训练过程中使用了多达2.5万亿个数据令牌,帮助我们更好地理解和生成语言。 那么…
在人工智能的世界里,语言的界限正在被不断打破。ElevenLabs最新推出的Turbo2.5模型,以其卓越的性能和多语言支持,再次证明了这一点。 ElevenLabs的新款Turbo2.5模型,不仅支…
近日,LMSYS组织的大模型竞技场(Chatbot Arena)发布了最新的榜单更新,LMSYS Chatbot Arena 排行榜上总排名11超过了所有开源模型,包括Llama3-70B、Qwen2…
在视频理解领域,传统的AI模型往往只能处理时长较短的视频,面对几小时甚至更长的视频内容时显得力不从心。这主要是因为这些模型在处理长视频时会遇到“噪声与冗余”以及“内存与计算”限制。现在,一种名为Gol…