内容持续更新中
加利福尼亚的初创公司Nucleus AI发布了22B参数的大规模语言模型,计划利用该技术改变农业供需优化。该模型可用于不同生成任务和产品的微调,具有出色的性能。Nucleus计划发布更多版本的该模型,…
一项研究测试了ChatGPT和GPT-4在模拟CFA金融分析师考试中的表现。结果显示,虽然GPT-4表现优于ChatGPT,但仍在高级别考试中面临挑战。专门培训和知识获取对提高AI在金融领域的表现可能…
近日,日立制作所搞出了一项厉害的自主技术,能够判断文章是不是由生成式 AI 创作的。 这技术可不简单,它是根据文章里词语的使用模式来判断的。为啥要弄出这么个技术呢?那是因为在未来,它用处大着呢!不仅能…
来自 UCSC-VLAA 团队的 “MedTrinity-25M” 大规模多模态数据集正式发布。这个数据集包含2500万张医学影像及详细注释。在医学领域中可谓是一次重要的创新,它拥有多粒度的注释,可以…
Meta Platforms今日发布其Llama模型的全新精简版本,包括Llama3.21B和3B两款产品,首次实现了大规模语言模型在普通智能手机和平板电脑上的稳定运行。通过创新性地整合量化训练技术与…
近期,纽约大学的研究团队发表了一项研究,揭示了大规模语言模型(LLM)在数据训练中的脆弱性。他们发现,即使是极少量的虚假信息,只需占训练数据的0.001%,就能导致整个模型出现重大错误。这一发现对于医…
近日,浙江大学与阿里巴巴达摩院联合发布了一项引人瞩目的研究,旨在通过教学视频创建高质量的多模态教科书。这一创新的研究成果不仅为大规模语言模型(VLMs)的训练提供了新的思路,也可能改变教育资源的利用方…
中国初创企业DeepSeek(深度求索)开发的高性能、低成本生成式AI大规模语言模型(LLM)近日引发全球关注。日本AI研究领域的权威、东京大学教授松尾丰在接受日本经济新闻采访时,对DeepSeek的…
今日,国内人工智能领军企业DeepSeek正式公开其开源计划的第四日成果——Optimized Parallelism Strategies(优化并行策略),重点推出双向管道并行算法DualPipe、…