科技魔方
  • 厂商动态
  • LLaMA微调显存需求减半 清华提出4比特优化器

    大模型的训练和微调对显存要求很高,优化器状态是显存主要开销之一。

  • 微信公众号机器之心
  • 592 0
  • ChatGPT网站流量连续第三个月下降

    OpenAI的ChatGPT无疑是一款备受好评的人工智能聊天机器人,报告显示其网站流量在2023年8月份连续第三个月下降。这一下降趋势表明了一些挑战,但也暗示着可能慢慢趋于稳定。

  • 站长之家 ChatGPT网站流量
  • 572 0
  • YaRN:可高效扩展现有大模型的上下文窗口长度

    YaRN是一种计算高效的方法,可以扩展基于 transformer 的语言模型的上下文窗口,与以前的方法相比,它需要10倍更少的 token 和2.5倍更少的训练步骤。

  • 站长之家
  • 624 0
  • 腾讯发布智驾云图 将与车企共建汽车行业大模型

    在今日的2023腾讯全球数字生态大会上,腾讯集团副总裁钟翔平表示,腾讯将与一些车企共建汽车行业大模型,包括座舱大模型、智能驾驶训练大模型、智能客服大模型等。

  • 站长之家 腾讯
  • 609 0
  • 清华提出4比特优化器 显著减少LLaMA微调的显存需求

    随着大模型规模的不断增大,显存需求成为模型训练的主要瓶颈之一。

  • 站长之家 清华LLaMA
  • 555 0
  • Web3新品牌ZAN亮相外滩大会 为海外客户提供全栈安全可信技术

    9月8日上午,Web3品牌ZAN在外滩大会正式发布,为香港及海外市场提供面向Web3的技术解决方案,尤以安全合规类技术产品为主。

  • 站长之家 Web3外滩大会
  • 547 0
  • 微软测试新版画图工具,增加一键去除背景AI功能

    微软正在测试新版画图工具,该工具允许用户一键去除图像背景。

  • 站长之家
  • 611 0
  • ​澳大利亚新法规要求科技公司消除AI生成的虐待儿童图像

    澳大利亚新法规要求科技巨头如Google、Microsoft和DuckDuckGo从搜索结果中清除虐待儿童材料,并防止生成深度伪造图像。

  • 站长之家
  • 632 0
  • eBay推出AI生成工具,卖家上传图片即可生成产品列表

    eBay最新引入的AI工具可利用卖家上传的图片,自动生成产品标题、描述和相关分类。

  • 站长之家
  • 675 0
  • 大模型上车:先打广告 再看疗效
    大模型上车:先打广告 再看疗效

    在今年ChatGPT火爆全球后,大模型成为AI显学,一度号称“所有行业都值得用大模型重做一遍”。

  • 远川研究所
  • 537 0
  • -------------没有了-------------

    图赏更多>