医疗xr是什么AI赋能进行时：不止于效率，香氛、医疗、XR三大赛道迎来颠覆性变革！-上海聚慕医疗器械有限公司

在视觉与听觉被计算机充分“摄取”之后，人类最古老也最神秘的感官——嗅觉，正在被推上算法与产业的前台。

过去两年，一批跨学科团队把“分子结构→气味语言”的映射从朦胧猜测推向可工程化的模型，并开始在香精香料、医疗健康、XR沉浸式内容、供应链风控等场景落地。

这不是“闻香水”的小众话题，而是在用AI破解“嗅觉编码”，为机器打开一个尚未规模化开发的数据维度。

2023 年发表在 Science的研究将图神经网络用于嗅觉映射，提出“主气味图”（Principal Odor Map, POM）：在一个高维嵌入空间中，气味相近的分子被投射到彼此邻近的位置。

更关键的是，在对 400 个从未见过的分子做盲测时，模型生成的气味描述与专业嗅评小组的均值更为接近，超过了“人类中位嗅评员”的一致性水平，这意味着“从结构预测气味”的可靠性首次跨越了关键门槛。

该工作亦验证了在结构-气味不连续的困难样本上，模型能以明显高于传统基线的方法捕捉正确的感知关系。这为“可泛化的嗅觉表征”奠定了技术基石。

沿着这条路线从“读”到“写”，Google Brain 出身的 Alex Wiltschko 创立 Osmo，试图把 POM 一类的嗅觉表征转化为可用的工程体系。

2025 年 3 月，Osmo 宣布“Generation”——号称“全球首家由 AI 驱动的香氛公司”，利用“嗅觉智能（OI）”把文本、图像灵感转化为可执行的配方，并发布了由算法辅助发现的三种“独家分子成分”。这标志着从“预测气味”迈向“生成与配方优化”的读写闭环。

“数字嗅觉”的技术谱系正在分化为两条主干：一条由“分子→感知”的建模牵引，另一条由“传感器→场景”的系统工程牵引。

第一条主干以 Osmo 为代表，强调以数据与模型重构“气味语义空间”，并把这一表征迁移到香氛创制、原料替代、合规与安全评估、乃至公共健康中的“嗅觉判别”问题。

其团队及相关论文多次指出训练数据来源于香精香料行业的 GoodScents、Leffingwell 等数据库——这也埋下了未来“数据治理”的伏笔：当私域数据成为模型性能的关键投入时，行业需要更开放、标准化的公共数据工程。

第二条主干强调“把嗅觉接入设备与场景”。日本京都的 Aromajoin 在 2024–2025 年围绕 XR 场景推出可穿戴与“气味音箱”等释放设备，试图把“气味的时间轴与虚拟场景”同步，做成沉浸式媒体的一环。

这种路线不是在“识别气味”，而是在“精准、可控地再现气味”，为内容分发与体验经济提供一个新维度。

与此同时，面向检测与质量控制的“电子鼻（e-nose）”产业链也在加速：法国 Aryballe 的 NeOse™ 用生物功能化硅光子芯片做 64 通道阵列，把“气味指纹”转成可分析的光学信号；厂商与学术界在 DOS 2024 等会议上密集展示车内空气、共享出行等应用原型，试图形成“多行业共用的嗅觉监测底座”。

要想让嗅觉走到“规模化工程”的阶段，必须回答三个底层问题。

其一，气味空间可被压缩为稳定的嵌入。POM 的意义不只在指标，更在于它像“色轮”一样提供了可对齐的空间坐标，让跨分子、跨任务的迁移成为可能。

后续研究继续探索“代谢距离”“振动谱”等线索与气味相似性的关系，提示自然界的化学—感知结构存在可学习的低维投影。

其二，传感信号可被稳定采集并消除漂移。e-nose 的实际瓶颈从来不是“有没有信号”，而是“信号在温湿度、老化与复杂混合物下是否可复现”。

最新综述与实验表明，包括金属氧化物、导电聚合物、表面声波（SAW）、石墨烯/激光诱导石墨烯等器件路线在敏感度、响应-恢复、功耗与可量产性上各有取舍，而“自适应学习+标准化采集协议”是穿越漂移与域移的共同抓手。

其三，多模态对齐会是拐点。2025 年的两篇立场与数据集论文明确指出：嗅觉之所以长期滞后，根源在于缺乏统一基准、规模数据与跨模态标准；面向真实世界的“SmellNet”尝试把便携式化学传感与 GC-MS 高分辨谱图做对比学习，尽管在 50 类在线分类任务上准确率仍不高，但为“嗅觉—视觉—语言—分子”对齐打开了路径。标准与基准，将是把学术红利转成产业通用能力的关键。

（1）香精香料的算法化重构。全球香氛/香水市场在 2024–2025 年规模在 500–600 亿美元量级，多个机构预计未来 5–8 年保持 5% 左右年复合增长。在这一存量空间里，AI 的价值不是“做一瓶更香的香水”，而是把“配方发现—法规合规模拟—原料替代—市场预测—生产工艺”纳入同一数据闭环。Osmo 把“文本/图像→配方”的能力与“生成新分子”的库结合，开始缩短创制周期并探索更可持续的合成路径，这与行业合规（如 IFRA 原料限制）与供应链波动形成正反馈。

（2）医疗健康：呼气组学的非侵入式筛查。呼气中可检测的挥发性有机物（VOC）已知超过千种，AI-e-nose 与 GC-MS/电化学传感结合被认为是肺癌、慢阻肺、肾病、帕金森等早筛的潜在低成本前沿。最新系统综述与临床综述显示，e-nose 在肺癌等任务上展现出“快速、无创、点位检测”的优势，但仍需更大样本、横向标准、与影像/分子标志物的联合验证。产业含义很清晰：当医院场景具备“可校准、可追溯、可互认”的 VOC 标准与接口，呼气传感就可能成为体检套餐里的“新生命体征”。

（3）沉浸式内容与消费体验。Aromajoin 的 XR 气味释放设备把“场景触发—气味释放—用户感知”的链路标准化，类似于“空间音频”之于听觉。其价值不在“噱头”，而在“时间控制与复现一致性”：如果创作者能在不同终端上复现近似的气味曲线，嗅觉就具备了成为“媒体资产”的前提。下一步的工程挑战，是把“嗅觉片段的创作、分发、版权与付费”纳入内容管线。

当下最现实的风险并非“AI 抄袭味道”，而是“谁拥有训练数据与气味语言”。

POM 的一大隐忧在于高性能离不开 GoodScents/Leffingwell 等行业私有语料与标注；而不同文化与语言对气味词的使用差异，又会把偏见与噪声写入模型。

2024–2025 年，Pyrfume 项目在 Nature Scientific Data上系统整理开放的嗅觉数据，并发起“可复现、可互操作”的数据工程倡议；同时，多篇立场文呼吁建立跨领域基准，把嗅觉纳入“具身智能”的核心能力清单。这意味着：谁先把数据标准做对，谁就掌握了“气味操作系统”的话语权。

嗅觉并不只服务于“审美”。研究已经在探索用呼气/体味做身份认证与健康状态识别，甚至发展出“耳后气味”“手部挥发物”的个体指纹。

生物识别的监管经验提示我们：一旦嗅觉数据进入身份、安全、保险等高敏领域，采集同意、用途限定、存储周期、可撤回权与可审计性必须先行。

嗅觉数据与声纹、指纹不同，它高度情境化且可能泄露健康信息，合规边界需更为严谨。

从产品技术视角来说，建议把“AI 嗅觉”拆解为三层工程目标，并据此布局：

第一层是表征层：以 POM/分子—感知嵌入为核心，把行业语料做“跨语种、多群体、跨场景”的再标注与对齐，避免单一英语语料导致的投射偏移。与 Pyrfume 等开放项目对接，参与制定“气味词汇—分子—传感信号”的统一 Schema。

第二层是传感层：在金属氧化物、石墨烯、SAW、CMOS 气味成像等路线中，结合制造业在 MEMS、封装、校准治具的优势做“可量产”的器件平台，同时固化“温湿度补偿—老化漂移—在线自校准—标准样本盒”的维护流程，让 e-nose 能够在社区医院、车内、仓储、海关等“非洁净实验室”跑得稳。

第三层是应用层：优先打“高频可评价”的场景。医疗端以呼气筛查的并联验证为起点（与影像/分子标志物做多模合并判读），消费端以“香氛创制的供需协同平台”为支点（把原料、法规、市场反馈联动），工业端以“气味风控（假货/掺假/泄漏）与车内空气治理”为切入。每条链路都要把“数据—模型—反馈—再训练”的闭环产品化，避免“局部演示效应”。

就短期变现路径而言，香氛行业具备“高毛利+强主观体验+可被算法加速”的特征，是最先可见的现金流入口；医疗健康的天花板最高，但对标准、可解释性、证据等级与支付体系的要求也最严；XR/内容释放设备的商业价值取决于“可控复现+内容生态+标准接口”。因此，正确的节奏是：先从香氛创制/风控的 B2B 数据闭环起步，围绕标准推动医疗与内容生态。

2025 年的两类新动向值得注意：一是“嗅觉标准化”成为具身智能的重要议题；二是“真实世界嗅觉数据集”的建设开始走向规模化与跨模态对齐。与此同时，最新的综述依然反复强调：e-nose 在医疗上的推广受制于器件耐久、漂移与跨中心验证；在产业上，市场虽处于增长通道，但更迫切的是“可信评测与互认”。这意味着今天更应该把资源投在“标准、数据与工具链”——这才是未来几年最具确定性的价值中枢。

把“气味”变成“数据”和“接口”，不是感官娱乐的花边，而是计算与产业的下一块版图。谁能在“表征—传感—标准—数据治理”四条线上同时推进，谁就可能在“气味经济”的操作系统上占据关键位置。2025 年，也许值得把它视作“AI 嗅觉元年”的开端。

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

01.大模型风口已至：月薪30K+的AI岗正在批量诞生

在这里插入图片描述

2025年大模型应用呈现爆发式增长，根据工信部最新数据：

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K（数据来源：BOSS直聘报告）

70%企业存在"能用模型不会调优"的痛点

真实案例：某二本机械专业学员，通过4个月系统学习，成功拿到某AI医疗公司大模型优化岗offer，薪资直接翻3倍！

02.如何学习大模型 AI ？

🔥AI取代的不是人类，而是不会用AI的人！麦肯锡最新报告显示：掌握AI工具的从业者生产效率提升47%，薪资溢价达34%！🚀

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

1️⃣ 提示词工程：把ChatGPT从玩具变成生产工具
2️⃣ RAG系统：让大模型精准输出行业知识
3️⃣ 智能体开发：用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你：
✔️ 大厂内部LLM落地手册（含58个真实案例）
✔️ 提示词设计模板库（覆盖12大应用场景）
✔️ 私藏学习路径图（0基础到项目实战仅需90天）

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述