文本最新相关新闻-科技魔方_中文AI大模型门户网站

文本最新相关新闻

小型文本转语音模型Kokoro-TTS，曾拿下TTS排行榜第一

Kokoro是一款新发布的语音合成模型，具有8200万参数，迅速在TTS领域崭露头角。

科技魔方 大模型模型文本

747

NeuralSVG:从文本生成可编辑的矢量图形

NeuralSVG 是一种创新的方法，利用文本提示生成矢量图形，为艺术家和设计师提供了灵活高效的工具。

科技魔方 NeuralSVG文本矢量图

537

OuteTTS-0.1-350M: 一种新颖的文本转语音合成方法

Oute AI 最近发布了一种名为 OuteTTS-0.1-350M 的文本转语音合成方法，采用纯语言建模，简化了 TTS 方法，具有零样本语音克隆功能，适用于广泛的应用领域。

科技魔方 OuteAI文本大模型

701

超快速文本转语音模型Lightning：超低延迟， 100毫秒生成10秒音频

最新推出的AI文本转语音模型Lightning在100毫秒内生成10秒音频，大幅降低语音机器人开发成本，提高可及性。

科技魔方文本大模型模型音频应用

634

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o1，Agent一夜变天

Anthropic AI这周终于有了大动作——首发Claude3.5Haiku，全新升级版Claude3.5Sonnet也来了。

新智元公众号 大模型电脑文本代码

543

苹果多模态模型大升级！文本密集、多图理解，全能小钢炮

近日，一向画风精致的「苹果牌AI」，也推出了升级版的多模态大模型，从1B到30B参数，涵盖密集和专家混合模型，密集文本、多图理解，多项能力大提升。

新智元公众号

581

普通的文本识别已经out了！GOT-OCR2. 0 还懂公式和乐谱

GOT-OCR2.0是一款引起业界广泛关注的端到端OCR模型，不仅能处理常规文本识别任务，还能处理公式、表格、乐谱等复杂内容，具有多样化功能和卓越

科技魔方 大模型模型文本

698

上海科大等开源创新模型：文本生成精美3D服装

上海科技大学、宾夕法尼亚大学、Deemos科技和NeuDim科技的研究人员联合推出了一个创新模型DressCode。

AIGC开放社区公众号 上海科大大模型文本开源

539

OpenAI承认正研发ChatGPT文本水印：可被单独工具检测到

OpenAI正深入探索文本水印技术的前沿领域，然而，该公司坦言，这一创新领域仍面临重重技术挑战与待解难题。

快科技 OpenAIChatGPT文本

625

阿里国际站AI生意助手再升级：文本类AI生成能力完全免费

在7月31日于法国巴黎举办的发布会上，阿里巴巴国际站总裁张阔宣布了B2B AI采购搜索引擎的全新发布，并展示了AI生意助手的最新升级。

AIbase基地 阿里国际站文本AI

665

ChatGPT等模型疯狂训练，最快2026年消耗尽公开文本数据

AI发展科研机构Epochai在官网发布了一项，关于大模型消耗训练数据的研究报告。

AIGC开放社区公众号 ChatGPT大模型文本

590

Wix推出AI工具，通过文本描述生成iOS或Android应用

Wix，这个以网页设计工具闻名的平台，推出了一个新的 AI 功能，允许用户通过用简单的中文描述想要看到的内容来创建和编辑 iOS 或 Android 应用。

站长之家 Wix文本iOSAndroid应用

650

AI图案生成器Ideogram Tile:文本生成无缝重复的图案

人工智能初创公司 Ideogram 以其先进的文本转图像生成功能而闻名，如今宣布其平台迎来重大升级:Ideogram Tile。这一新功能允许用户从单个文本提示中创建无缝重复的图案，为设计师、艺术家和企业开辟了无限可能。

站长之家 AI图案Ideogram文本图像人工智能

624

去除对齐和偏见，多功能文本生成模型Dolphin Mixtral 1x22b

Dolphin2.9.1Mixtral1x22b是由Cognitive Computations团队创建的一个多功能文本生成模型。

站长之家 文本生成模型文本大模型DolphinMixtral1x22b

648

新一代多模态内容生成模型Lumina-T2X 生成质量更高，成本更低

Lumina-T2X 是一个创新的内容生成系列模型，它采用了统一的 DiT(Diffusion Model)架构，能够通过文本生成图像、视频、多视角3D 对象以及音频剪辑。

站长之家 大模型文本图像视频

672

智谱AI研发国产文生视频模型对标Sora 最快年内发布

智谱AI正在研发对标 OpenAISora 的高质量文生视频模型，预计最快年内发布。

站长之家 智谱AI大模型文本Sora

623

苹果iOS 18或迎AI升级：手机不联网也能分析和生成文本

一个多月前，苹果公司在官网宣布，将于北京时间6月10日至15日在线举行“年度全球开发者大会”(WWDC)。新闻稿提到，活动旨在展示iOS、iPadOS等一系列操作系统的前沿创新。

财联社 大模型苹果苹果iOS18手机AI文本

600

讯飞星火焕新，上线“超级知识助手”，跳出“长文本”混战

科大讯飞的星火大模型V3.5春季上新，一句话声音复刻功能让科技更有温度;推出星火智能体平台，助企业解决大模型应用落地“最后一公里”难题;确定6月27日正式发布讯飞星火V4.0……

锌刻度公众号 讯飞星火科大讯飞文本大模型

732

中国首个Sora级大模型Vidu：文本生成16秒，1080p高清视频

4月27日，在2024中关村论坛-未来人工智能先锋论坛上，清华大学联合生数科技正式发布了，中国首个长时间、高一致性、高动态性视频大模型——Vidu。

AIGC开放社区公众号 Sora大模型文本视频

552

“动态排版”技术Dynamic Typography 可将文本字母转化为动画

一种名为Dynamic Typography的创新“动态排版”技术，正在为文本表达开辟新天地。这项技术通过视频扩散先验，将文本字母转化为动画，从而增强语义表达和动态效果。

站长之家 大模型文本

595

MoA：用于图片合成的混合注意力架构可实现风格参考和人物融合

在最新的研究中，提出了一种名为注意力混合模式(MoA)的新架构，旨在个性化文本到图像扩散模型，可以实现风格参考和人物融合的效果。

站长之家图片大模型文本图像

554

文本生成8K、360度全景世界！Model 3重磅发布

知名生成式AI平台Blockade Labs在官网重磅发布了全新模型——Model3。

AIGC开放社区公众号 大模型文本Model3AI

629

马斯克XAI发布Grok-1.5 Vision 多模态模型可处理文本和图片信息

在人工智能领域，多模态模型的发展一直是行业关注的焦点。近日，马斯克X AI公司发布了其最新的多模态模型——Grok-1.5Vision，这一模型不仅能够处理文本信息，还能够理解和分析各种视觉数据，如文档、图表、截图和照片，标志着公

站长之家 马斯克大模型文本图片

643

报道称百度文心一言即将免费开放200万 -500万长文本能力

据《科创板日报》报道，该报记者从知情人士获悉百度即将免费开放200万 -500万长文本能力。

站长之家百度文心一言文本

563

360智脑内测500万字长文本处理功能将引入360AI 浏览器

日前，360智脑宣布正式内测500万字长文本处理功能。这一功能即将加入360AI 浏览器，同时该浏览器的 APP 也即将上线。

科技魔方 360智脑文本大模型浏览器

659

-------------没有了-------------

图赏更多>

: 2025Q1鲁大师PC排行榜：新品井喷，格局重塑

: Spectrum数字化仪卡将海豚声呐点击转为鼠标点击

: 鲁大师2025年手机Q1季报：ROG成功卫冕性能榜，OPPO延续流畅榜大满贯

: 斯坦福最新AI研究报告出炉中美模型质量差距缩小至0.3%

: 谷歌 AI 模式新增多模态搜索，支持图像提问功能

: 鲁大师2025年新能源汽车Q1季报：全新驾舱流畅榜单上线，极氪车机强势翻身

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

叶紫

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

康佳（KONKA）55D6S

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>