科技魔方
  • 视觉最新相关新闻
  • 百度复旦视觉生成模型Hallo2或将落地数字人等场景
    百度复旦视觉生成模型Hallo2或将落地数字人等场景

    近日,百度联合复旦大学等发布Hallo2,一个可以生成长达数小时且分辨率为4K的人物动画的视觉模型。

    全新视觉识别技术Revisit Anything

    通过特征提取、聚类中心生成和SegVLAD管道运行,用户可以获取高效的识别结果。这项研究推动了视觉位置识别领域的发展。

  • 科技魔方 视觉大模型模型
  • 603 0
  • 清华大学团队研制出世界首款类脑互补视觉芯片“天眸芯”

    精密仪器系类脑计算研究团队聚焦类脑视觉感知芯片技术,提出了一种基于视觉原语的互补双通路类脑视觉感知新范式。该范式借鉴人类视觉系统的基本原理,模仿人类视觉系统的特征,形成两条优势互补、信息完备的视觉感知通路。

  • 爱集微 视觉芯片大模型
  • 533 0
  • Llama3-V:全新开源视觉大语言模型正式亮相
    Llama3-V:全新开源视觉大语言模型正式亮相

    AI界近日迎来了一项重大突破,一款名为Llama3-V的全新开源视觉大语言模型正式亮相。据称,Llama3-V基于Llama38B和siglip-so400m构建,被业界誉为最先进的视觉大语言模型之一。

    美团、浙大等提出视觉任务统一架构VisionLLAMA

    近期提出的 VisionLLaMA 架构在视觉任务领域取得了突破性进展。该架构致力于解决视觉和语言模态之间的架构差异,通过引入类似于 LLAMA 的统一接口,将视觉任务推向了一个新的高度。

  • 站长之家 美团浙大视觉大模型
  • 601 0
  • 机器人Ameca已经具备视觉能力 类人反应令人惊叹

    在科技领域,类人机器人Ameca的最新进化令人瞩目。通过拥有视觉能力和多模态AI功能,Ameca不仅能够观察周围环境,还能模拟人类的情感和反应。这种进化背后涉及了多领域技术的融合,包括语言模型、图像生成和语音识别等。

  • 站长之家 机器人视觉模态AI
  • 594 0
  • 研究: AI代替打工人成本太高,只有23% 视觉工作可替代

    1月25日 消息:根据 MIT 计算机科学与人工智能实验室的研究,人工智能对打工人的淘汰速度可能比人们想象中的要慢得多。这是因为对于企业来说,视觉 AI 实在是太贵了。在绝大多数情况下,人力成本要比采用自动化更便宜。

  • 站长之家 AI人工智能视觉
  • 592 0
  • 年度技术突破新物种:美图视觉大模型MiracleVision

    1月20日,凭借独特的美学价值、扎实的场景能力,美图自研AI视觉大模型MiracleVision(奇想智能)被评为“年度技术突破新物种”。

    智源推Vision Mamba 高效处理视觉任务,内存能省87%
    智源推Vision Mamba 高效处理视觉任务,内存能省87%

    Vision Mamba 是一种新的视觉模型,通过引入状态空间模型(SSM)来进行视觉建模,并在 ImageNet 分类、COCO 对象检测和 ADE20k 语义分割任务上实现了更高的性能。

  • 站长之家 智源视觉
  • 691 0
  • 维基百科+大模型打败幻觉!斯坦福WikiChat性能领先GPT-4
    维基百科+大模型打败幻觉!斯坦福WikiChat性能领先GPT-4

    斯坦福大学的研究人员利用维基百科数据训练了一个大模型,命名为WikiChat,通过优化和改进,成功解决了大模型的幻觉问题,并在事实准确性和其他指标上表现优秀。

  • 站长之家 维基百科视觉性能GPT-4
  • 626 0
  • 美图AI视觉大模型MiracleVision奇想智能将向公众开放
    美图AI视觉大模型MiracleVision奇想智能将向公众开放

    1月2日,美图公司自研AI视觉大模型MiracleVision(奇想智能)通过《生成式人工智能服务管理暂行办法》备案,将面向公众开放。

  • 站长之家 美图AI视觉大模型
  • 777 0
  • 美图AI视觉大模型MiracleVision将向公众开放
    美图AI视觉大模型MiracleVision将向公众开放

    1月2日,美图公司自研AI视觉大模型MiracleVision(奇想智能)通过《生成式人工智能服务管理暂行办法》备案,将面向公众开放。

    智谱 AI 开源视觉语言模型 CogAgent 支持GUI图形界面问答

    智谱 AI 开源了 CogAgent,它是一个视觉语言模型,拥有180亿参数规模。该模型在 GUI 理解和导航方面表现出色,在多个基准测试上取得了 SOTA 的通用性能。

  • 站长之家
  • 671 0
  • 全新视觉提示方法SoM 让GPT-4V看的更准、分的更细

    研究人员推出了一种新的视觉提示方法 Set-of-Mark(SoM),它可以让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。

  • 站长之家 视觉GPT-4V
  • 595 0
  • 美图吴欣鸿:自研视觉大模型MiracleVision已迭代至1.5版本

    8月3日,美图创始人、董事长兼CEO吴欣鸿参加第四届中国人工智能大赛成果发布会。在会上,吴欣鸿透露,目前美图自研视觉大模型已迭代到1.5版本,并应用于美图旗下多款产品。

  • 站长之家 美图大模型视觉
  • 576 0
  • 什么是计算机视觉?

    在电影《黑客帝国:复活》(2021年)中,主人公尼奥与电脑生成的世界“黑客帝国”战斗,他的战士团队聚集在一组电脑周围,试图找到尼奥的搭档崔妮蒂,她仍然被困在黑客帝国中。

    苹果计算机视觉框架Vision支持追踪动物全身姿态

    在2017年时,苹果曾推出基于Core ML的计算机视觉框架Vision,就像它名字里暗示的那样,计算机视觉也是Vision Pro头显的重要功能之一。

  • 青亭网 苹果计算机视觉
  • 635 0
  • 计算机视觉技术即将迎来重大转变
    计算机视觉技术即将迎来重大转变

    计算机视觉是否会再次自我改造?

  • 千家网 视觉
  • 744 0
  • 日本视觉艺术家AUTO MOAI带来日本精工5运动款无面人物限量版

    日本视觉艺术家AUTO MOAI将日本精工5运动手表作为最新作品的画布,这两件限量版的作品带有艺术家的无脸人物图案。

  • 科技魔方 视觉
  • 654 0
  • 苹果或已收购AI视觉搜索初创公司Fashwell

    8月8日消息,据国外媒体报道,苹果可能已经收购了AI视觉搜索初创公司Fashwell。

  • TechWeb.com.cn Fashwell初创视觉
  • 362 0
  • 高通新专利提出『通过AR头显进行视觉搜索』解决方案

    从与歌尔合作发布的XR1参考设计到刚刚结束的Qualcomm & Pico XR创新应用大赛奖,高通一直在积极地探索沉浸式领域。

  • 映维网 专利高通视觉
  • 381 0
  • 索尼日本工作室分享如何实现《Astro Bot 》视觉风格

    2019年01月25日,斩获TGA最佳VR游戏的《宇宙机器人:搜救行动》(Astro Bot Rescue Mission)是一款来自索尼日本工作室的作品,玩家需要控制太空船舰长并搜索自己失散的船员。

    苹果新专利曝光 可通过GPS和视觉识别器来识别车辆
    苹果新专利曝光 可通过GPS和视觉识别器来识别车辆

    苹果公司每年都会去研发很多专利,但实际上,有很多的专利并没有实施下来。而最近,从美国专利商标局公布的专利申请来看,苹果提交了一项名为“帮助识别到达车辆的增强现实接口”的新专利。

  • 镁客网 专利识别器视觉
  • 538 0
  • 美研究员用VR研究人类视觉系统对太空环境的适应性

    2018年12月03日,漫步月球的宇航员已经有足够的危险情况需要面对。过低的重力,极端的温度,辐射,整个区域都是尘土满溢。如果这还不够,我们用来感知深度和距离的视觉感知线索并不按照地球的规则运作,所以人类的眼球可以变成“

    Instagram发布AI图片描述功能 可帮助视觉障碍者发布内容

    11月29日消息,据The Verge报道,Instagram宣布正式推出AI图片描述功能,用于帮助视觉障碍用户也可以轻松使用这款应用。

    -------------没有了-------------

    图赏更多>