您的位置:首页 > 互联网

中文多模态模型问世!IDPChat生成图像文字,只需5步+单GPU

发布时间:2023-04-16 20:29:42  来源:互联网     背景:


新智元报道

编辑:桃子 拉燕

福特 F-150 Lightning

【新智元导读】中文多模态模型IDPChat来了,快速上手教程在此。

中文多模态模型IDPChat和大家见面了。

随着GPT4、文心一言等的发布,预训练大模型正式开启由单模态向多模态模型演进。多模态的特性为语言模型带来更加丰富的应用场景。

我们认为,未来的AI应用将主要以大模型为核心基石。

而在大模型的领域,基于基础模型(Foundation model)构建领域或企业自有的大模型,会是近中期的重要发展趋势。

但在私有化大模型微调和应用方面,企业和机构仍面临着微调复杂、部署困难、成本较高等种种工程化挑战。

白海作为AI基础软件服务商,我们希望能够从AI Infra层面,提供端到端的大模型微调、部署和应用工具,降低大模型微调和应用的门槛。白海科技IDP平台目前提供了从大模型数据源接入到大模型微调训练、模型发布的全流程功能。

我们以IDP平台为工具支撑,以预训练大语言模型LLaMA和开源文生图预训练模型Stable Diffusion为基础,快速构建了多模态大模型应用IDPChat。开发者们可根据场景需求,便捷地对其进行微调优化。

项目地址:https://github.com/BaihaiAI/IDPChat

IDPChat 能做什么

IDPChat目前可以同时支持文字对话和图片生成。

首先是图像生成,我们可以让模型根据文字描述画一幅画。


基础的文字对话聊天示例,可支持中文。


IDPChat 快速上手

仅需简单的5步和单GPU,即可快速启用IDPChat。

操作步骤如下:

1. 修改 ./backend/app/stable_diffusion/generate_image.py 文件,设置 diffusion_path 的值为本地 stable-diffusion 模型存储路径,设置 trans_path 的值为本地中文翻译模型的存储路径

2. 修改 ./backend/app/llama/generate_text.py 文件,设置 load_model 的 base 参数值为本地 llama 模型的存储路径

3. 执行 build.sh 脚本进行编译

4. 编译成功后执行 run.sh 脚本启动服务

5. 服务启动成功后,在浏览器中打开http://127.0.0.1:8000

在应用之前,需要下载准备所需的模型,LLaMA、Stable diffusion和相应的翻译模型。

具体所需的环境、模型、和操作步骤可以参考https://github.com/BaihaiAI/IDPChat

目前发布IDPChat初步版本,打通模型微调的全流程。

后续我们会继续对模型进行优化和丰富,如多模态部分增加图像描述功能。

当然要实现特定领域更高质量、针对性的表现,还需要基于领域数据的finetune和优化。

荣耀x40系列发布时间被曝

对 IDPChat 和 IDP 平台感兴趣的开发者小伙伴、场景应用伙伴等欢迎关注Github并联系我们。我们相信 IDP 平台和 IDPChat 将成为您探索多模态大模型应用和私有化大模型构建的得力助手。



返回网站首页

本文评论
百度给力春运 产品总动员送你回家
  到不了的地方叫远方,回不去地方的叫家乡。在春节这个国人最重要的传统节日,无论身处何方,一定要回到自己生长的地方,合家团聚,但首先要过的一关便是——春运,全球最大规模的...
日期:07-26
抢购白色iPhone4黄牛达百人 每人获劳务费50
  据网友反映,在获悉苹果将于4月28日在华发售白色版iPhone4后,很多苹果产品经销商雇佣黄牛前往苹果北京直营店抢购。据了解,由于苹果执行每人限购2台的政策,黄牛排队人数已达...
日期:07-27
作业盒子入选猎云网2019年度最具独角兽潜力创新企业TOP 20
  近日,猎云网颁布了“2019年度最具独角兽潜力创新企业TOP 20”榜单,通过企业实力、发展前景、行业口碑、团队潜力等多方面指标从过各行业领域中筛选出前20家独角兽企业...
日期:02-27
Google将发布补丁阻止SSL/TLS攻击(谷歌ssl错误怎么解决)
  实际上对付BEAST对SSL攻击的工作从今年 5、6 月份就展开了。BEAST 的两位研究人员也没在本周五正式发表前透露太多细节,不过 Google 显然不打算冒任何风险。BEAST 利用...
日期:07-23
跳过13?小米首款骁龙8 Gen2旗舰或为小米14 网友:绝配MIUI 14硬刚iPhone 14
骁龙8 Gen2发布后,小米第一时间宣布新旗舰将率先搭载,但并没有确认型号命名。马斯克退出推特日前网上出现显示为小米14包装图,网友纷纷留言表示,这要是打破奇数魔咒”,跳过13直接...
日期:11-19
拉卡拉公司市值_拉卡拉前三季度营收41.7亿元 净利润7.35亿元
10月23日消息,拉卡拉发布2020年第三季度财务报告,报告显示,第三季度营收16.14亿元,同比增长35.22%,归属上市公司股东净利润3亿元,同比增长19.86%。2020年前三季度,拉卡拉营收41.2亿...
日期:08-01
蕉下轻量化户外,即将引爆万亿级市场的下一个增长点?
声明:本文来自于微信公众号 新熵(ID:baoliaohui),作者:于松叶,授权转载发布。帐篷、烤炉、小彩灯微微闪烁、身边是幽幽的青草香,然后三五好友拍下精美的照片,发到社交平台作为美好...
日期:01-17
值得买科技双11战报:5分钟不到GMV破亿_双11战报出炉
11 月 15 日消息,值得买科技集团近日发布 2022 年双 11 大促战报,数据显示, 11 月 10 日 20 点双 11 大促正式开始后,“什么值得买”仅用 4 分 57 秒便实现GMV破亿,用户活跃度进...
日期:11-16
爱奇艺连续两季度盈利,龚宇:与抖音合作从第三季度起落实「爱奇艺二季度营收」
查看最新行情   记者/秦艺逍  8月30日,国内视频巨头爱奇艺(NASDAQ:IQ)发布截至6月30日的第二季度财报,连续两个季度实现运营盈利。  2022年第二季度,...
日期:09-01
国产手机不愿“背黑锅” 欲集体抵制恶意吸费
  深陷“吃费门”的国产手机终于无法忍受替山寨机“背黑锅”的不利局面。近日,联发科和展信通信两家国产手机芯片的提供商相继联合主要手机厂商,以签订协议书和发起“绿色...
日期:07-29
路边轿车挡道 SUV司机故意撞开 网友:很爽但应先联系114_开车撞路边拦
近日,在嘉兴平湖某菜市场,因一辆小型轿车违停,影响到原本停在车位线上的一辆SUV。SUV车主一怒之下,连撞违停车辆三下后驶离现场。视频中可以看到,这辆SUV在停车位正常停放,前面一...
日期:12-18
小米13号发布会有什么「线下绝密包装曝光:小米13 12月1日发布稳了」
最近的传闻多指出,小米13将于12月1日发布。包括电商的占位信息也显示,小米新品旗舰将于12月2日0点抢购。现在,一张疑似小米新品的线下保密包装泄露,封签上写着请店长于2022年12...
日期:12-04
Windows 8安全启动不会阻止其他操作系统载入
  据国外媒体消息,昨天红帽开发人员Matthew Garrett指出,Windows 8品牌认证机可能就无法安装其他操作系统,这与广大用户对微软的UEFI(统一可扩展固件接口)存有的疑问极其相...
日期:07-23
GPT-4过于强大引人担忧:马斯克等上千人呼吁暂停AI开发
早些时候,OpenAI发布了最新的GPT-4生成式人工智能多模态模型,它在各种专业和学术的标准测试中表现出了人类水平的性能。但同时,GPT-4的强大也引起了不少人的担忧。因此,在近日,一...
日期:03-29
希沃亮相宁夏教博会,引国内外参展人士关注
  9月17日-19日,由中国教育装备行业协会、自治区教育厅、宁夏教育信息化管理中心主办的“首届宁夏‘互联网+教育’装备博览会”暨产业发展高峰论坛在银川国际会展中心盛大...
日期:06-13
中国网络电视台启动上市程序 将于近期挂牌(央视网什么时候上市)
  1月4日上午消息,据香港媒体报道,央视国际网络有限公司总经理汪文斌日前表示,公司股份改造进展顺利,新股份公司将于近期挂牌,下一步将引进战略投资者,启动上市融资相关程序。...
日期:07-25
七牛云荣获“2019年度大数据最佳产品奖”(七牛云年会)
  12月19日,由中国科学院《互联网周刊》、中国社会科学院信息化研究中心、eNet研究院共同主办的2019(第十七届)中国互联网经济论坛在北京举行。同时,备受各界关注的“金i奖...
日期:12-07
2023年2月全球智能手机市场三星重新占据第一 苹果退居第二「2020年第二季度全球手机市场份额」
3月21日消息:TechhInsights指出,2023年2月全球智能手机出货量(批发)和销量(零售)分别同比下降11%和5%。尽管数字有所下降,但由于新开放和经济前景改善,智能手机市场从2023年1月开...
日期:03-23
柔性屏柔宇科技_外媒:可拉伸弹力柔性屏技术,柔宇远超韩国LG
  据国际知名权威媒体GSMArena报道,曾经发布了全球首款折叠屏手机FlexPai柔派的柔宇科技,近日发布业内首个Micro-LED弹力柔性屏技术。这项技术使得未来的显示屏幕能够附着...
日期:02-12
曝小米2月新机或超过6款!_小米多款新机曝光
  今天,知名数码博主@数码闲聊站透露,小米正在基于sm8475芯片开发三款工程机,其中一款测试50mp超大底镜头,两个测试1/1.5"大底镜头,均采用2K柔性屏。   同时,在评论中,该博主...
日期:01-08