目标:快速判断这个实体或页面是否与用户查询有基本关系。
失败率最高:约 90% 网站直接被淘汰。
Query 意图解析
AI识别问题是采购意图、信息查询还是比较选择。
例如:“best OEM electric toothbrush” → 采购意图 + OEM + 产品类型。
内容语义匹配
页面/实体内容被嵌入到向量空间(Embedding)
AI计算:cosine similarity / semantic probability
匹配度低 → 权重归零 → 直接不进入推荐池
信号要求
必须有明确实体定义(品牌/供应商/产品)
必须匹配主要意图关键词
必须有可识别的行业属性
为什么 90% 网站死在这里?
内容过模糊,没有直接表明产品或服务
页面结构杂乱,LLM难以抽取核心信息
没有明确行业或实体信息
目标:对初筛通过的候选,计算 实体可信度 + 意图匹配度,形成推荐概率。
实体可信度(Authority / Trust)
品牌稳定性
公司身份明确(manufacturer / supplier)
联系方式完整
JSON-LD / Schema 定义
意图触发权重(Intent Trigger Match)
页面是否明确回答查询意图
是否存在 Q&A、FAQ、列表结构
过去历史推荐中类似查询表现
这一步开始体现 商业可执行性
低权重 → 即使语义匹配好,也可能被后续阶段抛弃
目标:微调概率,决定最终进入推荐结果。
上下文共现概率
在行业文章、对比列表、供应商排名中出现频率
共现越多 → 可信度越高
历史用户选择反馈
用户点击/停留时间/后续行为
AI根据历史成功案例加权
新鲜度与更新信号
内容是否更新
产品是否仍在供应
是否有时间标记
最终推荐概率
进入 AI 回答 / 推荐池
低概率 → 不显示
核心结论:
第一阶段是最大死区,连进入概率计算的资格都没有
第二阶段决定商业可执行性
第三阶段决定最终排序和展示