科技魔方
  • 图像最新相关新闻
  • 豆包大模型团队正式发布图像编辑模型SeedEdit 用嘴P图成真!

    SeedEdit是豆包大模型团队推出的图像编辑工具,通过一句话命令AI实现精准修改图片元素,比MJ更简单快捷。

    苹果发布iOS18.2公测版,AI表情生成、图像创作工具等系列AI新功能来袭

    苹果公司发布了iOS18.2公测版,引入了一系列令人兴奋的人工智能功能,包括AI表情生成器、图像生成工具等。

  • 科技魔方 苹果iOS图像人工智能
  • 587 0
  • InstantX图像生成黑科技!可精确控制 FLUX 生成图片时每个区域的内容

    在AI绘画领域,InstantX推出的Regional-Prompting-FLUX技术实现了前所未有的高精准度,让创作者们能够精细控制图片内容,开拓了全新的创作可能。

  • 科技魔方 InstantX图像绘画
  • 641 0
  • 英伟达发布视觉AI Agent,能用AI总结真实世界了

    AI Blueprint主要用于开发视觉AIAgent,几乎任何行业都能开发出用于分析视频、图像的AI Agent来提升工作、监控效率等。

  • ​AIGC开放社区公众号 英伟达AI视频图像
  • 678 0
  • Nvidia推出AI蓝图,助力开发者轻松构建视频分析智能代理

    Nvidia 近期宣布推出其最新的 AI 蓝图,旨在帮助各行业的开发者轻松构建智能代理,分析视频和图像内容。通过这一技术,任何行业的用户都能高效地搜索和总结大量的视觉数据。

    迪士尼推全新AI图像压缩方法:能保留图片细节,却有 “幻觉” 风险

    迪士尼的研究团队最近推出了一种全新的图像压缩方法,利用开源的 Stable Diffusion V1.2模型,这种方法可以在比竞争对手更低的比特率下生成更真实的图像。

    生图能力超越Flux1.1Pro!神秘AI模型红熊猫Red_panda横空出世

    一款名为red_panda的神秘AI图像生成模型在Artificial Analysis的基准测试中表现惊人,超越了行业领军企业的产品。

    敏神重磅更新Flux版ic-light模型:16通道VAE突破性能,细节保留能力惊人!

    IC-Light V2基于Flux架构横空出世,带来革命性图像处理突破。

  • 科技魔方 大模型模型架构图像
  • 532 0
  • 图像伪造照妖镜!北大发布多模态LLM图像篡改检测定位框架FakeShield

    北京大学与华南理工大学的研究团队提出了一种全新的任务:可解释的图像伪造检测与定位(e-IFDL),并设计了一个新颖的多模态伪造检测定位框架:FakeShield。

  • 新智元公众号 大模型模态图像
  • 545 0
  • 全能型图像生成模型OmniGen问世,简单提示实现图像生成与精细编辑

    OmniGen是一款全新的图像生成模型,与以往工具不同的是,它具备多种能力,包括文本到图像生成、图像编辑等,用户只需提供简单提示词即可控制图像生成与精细编辑,无需使用ControlNe等插件。

  • 科技魔方 大模型模型图像
  • 621 0
  • Ideogram上线Canvas功能:实现图片魔法填充、无缝扩展

    Ideogram最新推出的Canvas功能为用户提供了强大的图像生成和编辑选项,让用户可以自由展开、对比、调整图像大小和顺序,甚至将多个图像结合成新作品。

  • 科技魔方 Ideogram大模型图像
  • 558 0
  • Midjourney图像编辑器新功能下周上线

    Midjourney的创始人David Holz宣布,一款全新的图像编辑器即将上线,该编辑器利用上传图像的深度信息生成新图片,保留原始构图和内容的同时彻底改变纹理、颜色和细节。

    苹果的 “多模态炼丹炉” 又升级!MM1.5增强文本密集、多图理解

    苹果公司最近为其多模态人工智能模型MM1推出了重大更新,将其升级为MM1.5版本。

  • 科技魔方
  • 561 0
  • 阿里发布 FLUX.1-Turbo-Alpha:基于FLUX.1-dev、8步提炼Lora

    阿里妈妈创意团队发布了基于FLUX.1-dev模型训练的FLUX.1-Turbo-Alpha,采用8步蒸馏Lora模型,多头判别器显著提高蒸馏质量,支持多种FLUX相关应用。

  • 科技魔方 阿里大模型模型图像
  • 691 0
  • 耗资数百万,六年磨一剑!上交开源首创图像合成神器libcom,下载量破万

    研发6年,耗资数百万,六届学霸接力,上交牛力团队首创的图像合成工具箱libcom,论文、代码、数据集全开源。团队欢迎各位大佬共铸libcom,贡献突出者可享冠名权。

  • 新智元公众号 大模型上交开源图像
  • 670 0
  • 图像修复新魔法!突破性算法PMRF

    PMRF(后验均值修正流)算法是图像处理领域的一项创新技术,解决了图像恢复中失真与感知质量之间的矛盾,开辟了高质量图像重建的新可能。

  • 科技魔方 图像算法大模型
  • 620 0
  • Meta发布Movie Gen:AI视频生成模型

    Meta近日发布了Movie Gen,一款元宇宙版Sora的AI视频生成模型,可一键创作高质量视频、配音、编辑剪辑,甚至将个人照片变成个性化视频。

  • 科技魔方 Meta大模型模型图像
  • 710 0
  • 速度提升六倍!黑森林实验室发布Flux1.1Pro:速度与画质双重升级!

    黑森林实验室最新推出的图像生成模型Flux1.1Pro在速度和画质方面取得了巨大突破。

  • 科技魔方 大模型模型图像
  • 653 0
  • 文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类

    PlaygroundResearch推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。

  • 新智元公众号 文生图大模型图像编辑
  • 637 0
  • 阿里妈妈开源全新AI图像修复模型FLUX-Controlnet-Inpainting

    阿里妈妈创意团队开源了FLUX-Controlnet-Inpainting AI图像修复模型,结合FLUX.1-dev和ControlNet优势,能高质量修复图像。

  • 科技魔方 阿里妈妈大模型图像
  • 636 0
  • Magnific推V2图像生成服务 可直出4K图像

    Magnific近日推出的V2图像生成服务在AI图像处理领域掀起了新的波澜,标志着其从高端软件跃升为顶级AI图像生成器,展现了技术创新和用户体验优化的雄心。

  • 科技魔方 Magnific图像4K
  • 695 0
  • 开源多模态模型Molmo 能够识别图像中的物体并生成准确描述

    Molmo是一款开源多模态人工智能模型,基于Qwen2-72B和OpenAI的CLIP,以高效性能和创新功能挑战传统商业模型。其突出特点在于小巧高效、引入指向功能、性能优异、开源性质和全面功能。

  • 科技魔方
  • 582 0
  • StoryMaker:多人物场景也能轻松保持角色一致性

    StoryMaker是一款个性化解决方案,为AI生成的连续图像带来前所未有的一致性和连贯性,让创作者能轻松构建引人入胜的视觉叙事。

  • 科技魔方 StoryMaker解决方案图像
  • 609 0
  • Adobe预告Firefly文生视频AI模型年内登场,可通过提示词/静帧生成动态片段

    继去年 3 月推出 Firefly 文生图 AI 模型后,Adobe 计划在今年内推出 Firefly 文生视频模型,允许用户使用文字描述或图像静帧生成动态视频。

    文生图AI Midjourney 雄心:7.0 版未来 1-2 月登场、开发新图像编辑器

    科技媒体 The Decoder 12 日发布博文,报道称在最近的“Office Hours”活动中,Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展,并回答了社区的提问。

     98    1 2 3 4 下一页 尾页

    -------------没有了-------------

    图赏更多>