Midjourney团队在最近的工作时间透露了他们在视频模型、3D模型、实时生成效果以及网站和模型开发方面的最新进展。以下是他们透露的关键信息:
昨晚的Google I/O发布会上,Google宣布了一系列AI模型的更新,涵盖了从文本到视觉和音乐的多个领域:
日前,微软宣布OpenAI最新发布的多模态模型 GPT-4o 现已可以在 Azure OpenAI 云服务中使用。
Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。
IBM 最近发布了一组名为 "Granite Code" 的开源型,旨在帮助企业完成各种软件开发任务,并在基准测试中表现出色。这些模型不仅过了一些较大的开源竞争对手,而且在编程任务中展现出了强大的性能。
Phi-3WebGPU是一款由Xenova提供的AI模型,它在Hugging Face Space中推出,允许用户直接在浏览器中本地运行AI模型。这一创新工具结合了Transformers.js和onnxruntime-web,为用户提供了一个私密且高效的AI体验。
OpenBuddy团队发布了基于 MetaLlama370B的最新成果:OpenBuddy-Llama3-70B-v21.1-8k,这是他们首次在 Llama370B 基座上的中文跨语言训练尝试。
OpenAI 最近发布了一份名为 “Model Spec” 的新文件,旨在向用户提供更深入的了解其人工智能模型。
MistoLine是一个SDXL-ControlNet模型,它在处理各种线条艺术作品方面展现出卓越的性能。
最新发布的AlphaFold3是在2代模型基础之上研发而成,并且使用了全新扩散模型、Pairformer等创新模块,进一步增强对蛋白质的预测准确率以及架构解读。
OpenAI正在与另一家出版商合作,以授权获得培训数据。
DeepSeek在开源MoE(Mixture of Experts)模型领域取得了重要进展,继今年1月份开源国内首个MoE模型后,现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现,与GPT-4等闭源模型竞争,同时在
一份惠普企业(HPE)的新报告显示,急于实施人工智能的企业在有效部署模型所需的流程方面存在困难。这份名为《构建 AI 优势》的报告对来自14个国家的2400多名 IT 领导进行了调查。
确定性的机会指向的往往是需求场景,需要实干家,不断优化体验;而不确定的机会往往依托于技术创新,需要冒险家,探索出一条通向应用的路径。这也是为什么人们不会惊讶于雷军下场造车的决心,却很难完全相信杨植麟在月之暗面创
Kimi的出圈显然也受到其他大模型厂商的关注,然后就像所有车企都开始学习雷军一样,一场由月之暗面率先打响,字节、智谱、昆仑万维、MiniMax跟进的线上营销大战就此全面铺开。
苹果公司正致力于通过其自研的大语言模型Ajax来革新和增强iOS18的用户体验。
近日,来自南京大学、上海人工智能实验室、复旦大学、浙江大学的研究队发布了一项关于视频理解的开创性工作。
Meditron是一个基于Llama的大型医学语言模型,由Meta公司更新并发布。Meditron项目是完全开源的,包括数据、模型权重和配置,这意味着全球的研究人员和开发者都可以自由地访问、使用、修改和改进这一技术。
苹果的研究人员推出了一种创新模型ReALM,可将参考解析问题转化为语言建模问题,能极大提升AI助手处理很多描述复杂或模糊不清的内容。
近日,一个名为GPT2Chatbot的神秘机器人在LMsys平台上引发了广泛关注。据悉,这个机器人的测试效果出奇的好,让人们对其背后的技术产生了浓厚的兴趣。
近日,微软研究人员提出的 LongRoPE 方法首次将预训练的大型语言模型(LLM)的上下文窗口扩展至2048k 个 token,实现了8倍的扩展同时保持原始短上下文窗口的性能,而无需进行架构变化和复杂微调。
-------------没有了-------------