科技魔方
  • 文本最新相关新闻
  • OuteTTS-0.1-350M: 一种新颖的文本转语音合成方法

    Oute AI 最近发布了一种名为 OuteTTS-0.1-350M 的文本转语音合成方法,采用纯语言建模,简化了 TTS 方法,具有零样本语音克隆功能,适用于广泛的应用领域。

  • 科技魔方 OuteAI文本大模型
  • 690 0
  • 超快速文本转语音模型Lightning:超低延迟, 100毫秒生成10秒音频

    最新推出的AI文本转语音模型Lightning在100毫秒内生成10秒音频,大幅降低语音机器人开发成本,提高可及性。

    Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天

    Anthropic AI这周终于有了大动作——首发Claude3.5Haiku,全新升级版Claude3.5Sonnet也来了。

  • 新智元公众号 大模型电脑文本代码
  • 539 0
  • 苹果多模态模型大升级!文本密集、多图理解,全能小钢炮
    苹果多模态模型大升级!文本密集、多图理解,全能小钢炮

    近日,一向画风精致的「苹果牌AI」,也推出了升级版的多模态大模型,从1B到30B参数,涵盖密集和专家混合模型,密集文本、多图理解,多项能力大提升。

  • 新智元公众号
  • 565 0
  • 普通的文本识别已经out了!GOT-OCR2. 0 还懂公式和乐谱

    GOT-OCR2.0是一款引起业界广泛关注的端到端OCR模型,不仅能处理常规文本识别任务,还能处理公式、表格、乐谱等复杂内容,具有多样化功能和卓越

  • 科技魔方 大模型模型文本
  • 669 0
  • 上海科大等开源创新模型:文本生成精美3D服装

    上海科技大学、宾夕法尼亚大学、Deemos科技和NeuDim科技的研究人员联合推出了一个创新模型DressCode。

  • AIGC开放社区公众号 上海科大大模型文本开源
  • 538 0
  • OpenAI承认正研发ChatGPT文本水印:可被单独工具检测到

    OpenAI正深入探索文本水印技术的前沿领域,然而,该公司坦言,这一创新领域仍面临重重技术挑战与待解难题。

  • 快科技 OpenAIChatGPT文本
  • 623 0
  • 阿里国际站AI生意助手再升级:文本类AI生成能力完全免费

    在7月31日于法国巴黎举办的发布会上,阿里巴巴国际站总裁张阔宣布了B2B AI采购搜索引擎的全新发布,并展示了AI生意助手的最新升级。

  • AIbase基地 阿里国际站文本AI
  • 659 0
  • ChatGPT等模型疯狂训练,最快2026年消耗尽公开文本数据

    AI发展科研机构Epochai在官网发布了一项,关于大模型消耗训练数据的研究报告。

  • AIGC开放社区公众号 ChatGPT大模型文本
  • 584 0
  • Wix推出AI工具,通过文本描述生成iOS或Android应用

    Wix,这个以网页设计工具闻名的平台,推出了一个新的 AI 功能,允许用户通过用简单的中文描述想要看到的内容来创建和编辑 iOS 或 Android 应用。

  • 站长之家 Wix文本iOSAndroid应用
  • 646 0
  • AI图案生成器Ideogram Tile:文本生成无缝重复的图案

    人工智能初创公司 Ideogram 以其先进的文本转图像生成功能而闻名,如今宣布其平台迎来重大升级:Ideogram Tile。这一新功能允许用户从单个文本提示中创建无缝重复的图案,为设计师、艺术家和企业开辟了无限可能。

    去除对齐和偏见,多功能文本生成模型Dolphin Mixtral 1x22b

    Dolphin2.9.1Mixtral1x22b是由Cognitive Computations团队创建的一个多功能文本生成模型。

    新一代多模态内容生成模型Lumina-T2X 生成质量更高,成本更低

    Lumina-T2X 是一个创新的内容生成系列模型,它采用了统一的 DiT(Diffusion Model)架构,能够通过文本生成图像、视频、多视角3D 对象以及音频剪辑。

  • 站长之家 大模型文本图像视频
  • 665 0
  • 智谱AI研发国产文生视频模型对标Sora 最快年内发布

    智谱AI正在研发对标 OpenAISora 的高质量文生视频模型,预计最快年内发布。

  • 站长之家 智谱AI大模型文本Sora
  • 619 0
  • 苹果iOS 18或迎AI升级:手机不联网也能分析和生成文本

    一个多月前,苹果公司在官网宣布,将于北京时间6月10日至15日在线举行“年度全球开发者大会”(WWDC)。新闻稿提到,活动旨在展示iOS、iPadOS等一系列操作系统的前沿创新。

    讯飞星火焕新,上线“超级知识助手”,跳出“长文本”混战

    科大讯飞的星火大模型V3.5春季上新,一句话声音复刻功能让科技更有温度;推出星火智能体平台,助企业解决大模型应用落地“最后一公里”难题;确定6月27日正式发布讯飞星火V4.0……

  • ​锌刻度公众号 讯飞星火科大讯飞文本大模型
  • 725 0
  • 中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频

    4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。

  • AIGC开放社区公众号 Sora大模型文本视频
  • 548 0
  • “动态排版”技术Dynamic Typography 可将文本字母转化为动画

    一种名为Dynamic Typography的创新“动态排版”技术,正在为文本表达开辟新天地。这项技术通过视频扩散先验,将文本字母转化为动画,从而增强语义表达和动态效果。

  • 站长之家 大模型文本
  • 589 0
  • MoA:用于图片合成的混合注意力架构 可实现风格参考和人物融合

    在最新的研究中,提出了一种名为注意力混合模式(MoA)的新架构,旨在个性化文本到图像扩散模型,可以实现风格参考和人物融合的效果。

  • 站长之家 图片大模型文本图像
  • 545 0
  • 文本生成8K、360度全景世界!Model 3重磅发布

    知名生成式AI平台Blockade Labs在官网重磅发布了全新模型——Model3。

  • AIGC开放社区公众号 大模型文本Model3AI
  • 626 0
  • 马斯克XAI发布Grok-1.5 Vision 多模态模型 可处理文本和图片信息

    在人工智能领域,多模态模型的发展一直是行业关注的焦点。近日,马斯克X AI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息,还能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公

  • 站长之家 马斯克大模型文本图片
  • 631 0
  • 报道称百度文心一言即将免费开放200万 -500万长文本能力

    据《科创板日报》报道,该报记者从知情人士获悉百度即将免费开放200万 -500万长文本能力。

  • 站长之家 百度文心一言文本
  • 557 0
  • 360智脑内测500万字长文本处理功能 将引入360AI 浏览器
    360智脑内测500万字长文本处理功能 将引入360AI 浏览器

    日前,360智脑宣布正式内测500万字长文本处理功能。这一功能即将加入360AI 浏览器,同时该浏览器的 APP 也即将上线。

    阿里推AtomoVideo文本+图片生视频模型,媲美Gen-2和Pika

    AtomoVideo的使用非常简便,用户只需提供高清图片和简单的文本提示即可在短时间内生成逼真的高清视频,并保留细致的细节。

  • 站长之家 阿里AtomoVideo文本
  • 555 0
  • MyShell多语言、多口音文本转语音库MeloTTS开源

    近日,MyShell公司宣布其多语言、多口音的文本转语音库MeloTTS正式开源。这一消息在开源社区引起了广泛关注。MeloTTS支持的语言包括英语、西班牙语、法语、中文、日语和韩语,为开发人员提供了丰富的选择。

  • 站长之家 文本大模型
  • 543 0
  • -------------没有了-------------

    图赏更多>