导图社区 AIGC市场分析
2024年AIGC的市场分析,中美现状,投资关键点,干货满满,感兴趣的小伙伴可以参考使用!
日本失去的三十年各行业的详细情况,包含小家电、 旅游、 零售业态、 家清、 美妆个护、食品饮料等。
社区模板帮助中心,点此进入>>
互联网9大思维
电影院包场服务流程
组织架构-单商户商城webAPP 思维导图。
暮尚正常运转导图
域控上线
培训计划思维导图
车队管理
python思维导图
七夕活动策划
供应链类型
生成式AI跟踪和展望
底层模型能力现状
MLLM
OpenAI-GPT4(V/Turbo)
Anthropic-Claude3
Google-Gemini 1.5, Gemma
Mistral AI & Meta & Bigcode…
Domestic players
多模态生成
OpenAI-DallE3, Sora
Stability AI – Stable Diffusion3
Midjourney – MJ V6
Google & Runway &…
Embodied AI
Google/Deepmind:Robotic Transformer, Palm-E
Tesla:FSD, Optimus
Institute:VoxPoser, ALOHA
技术迭代
文本类 (Text)
底层路线较清晰,大多基于Transformer底层中Decoder-only的架构发展改良,结合MOE和多模态embedding等
图像生成 (Image)
底层路线较清晰,之前参考扩散底层中的Stable Diffusion结构,目前升级为Diffusion Transformer
视频生成 (Video)
核心结构复杂,优化点多,包括编解码器、Patch化、Diffusion模块,Transformer模块、Clip模块和插帧模块
三维资产生成 (3D)
底层技术路线不清晰,存在多种结构,例如Nerf、扩散模型等
具身模型 (Embodied)
底层技术路线不清晰,例如利用VLM和LLM集合,但在推理和运控层面存在多种技术逻辑
应用落地
开源模型
Llama2、Gemma
Starcoder2, CodeLlama
SD系列
GPT Store
从插件市场到GPTs,早期热度高,但长期优秀的产品仍然需要专业开发者开发
Fine tuning
MOE和RAG等技术对Finetuning实现部分替代,并且FT仍然需要改善灾难性遗忘和更新时效问题
RAG
和向量数据库结合,在专业领域成本低、更新频率快且提升回答精准度降低幻觉,未来将大规模应用
Prompt Engineering
短期刚需长期终端需求可能降低,目前帮助用户自动扩写prompt和机器align的算法发展快
模型压缩
分为量化、压缩和剪枝等,应用刚需,尤其需要本地部署的C端和B端模型
Agent
应用广泛,但是发展初期,底层模型的reasoning、规划和幻觉问题需要解决
中美AI Native主流场景和产品
美国
Chatbot
ChatGPT, Claude, Bard
AI Search Engine
Perplexity,Phind
AI Image Editing/Generating
Remove.bg, Leonardo.AI, Yodayo,PixAI, SeaArt, Midjourney
AI Writer Generator
AI Character Generator
Character AI、Janitor AI,CrushOn
AI Tools for Education
Q-Chat, Cheggmate
Other productivity
Eleven labs, Gamma, Eightify
中国
经过接近2年的持续观察和跟踪,部分场景的头部企业辨识度变高,优秀企业也逐步和行业其他玩家拉开差距,例如MLLM和Chatbot,代码生成应用、视频生成的应用产品、法律、医疗均出现了头部企业
投资机会
底层模型供应商
投密度高,人才密度、资金密度、算力密度
技术和团队辨识度高,易垄断核心资源,获取相对的领先优势
存在技术迭代风险,更好的开源以及更新的模型架构都有可能降低现有底层模型厂商的技术优势
应用层产品(软件或者硬件)
投当前模型容易做的场景,不急于优化模型
借助最优模型技术迅速取得PMF和营收,技术风险小
但大部分产品同质化,需要寻找能够持续积累壁垒的商业模式
信息差带来的产品提前规划
端到端产品
投生态位最明确,头部辨识度最高的企业
场景选择:刚需痛点、产品有一定要求、客户愿意支付高客单(最好能带来创收)
数据优势:特定场景的数据源
产品迭代:可做厚,迁移成本高
运营数据:用户续约/CAC/客单价等