概率语义空间结合了:
知识图谱(Knowledge Graph) – 结构化实体与关系
向量空间(Vector/Embedding Space) – 实体和查询语义表示
概率推理(Probabilistic Reasoning) – 用户意图和行为预测
数学表示:
P(和∣问)=∑我P(我∣问)⋅P(和∣我)P(E|Q) = \sum_{I} P(I|Q) \cdot P(E|I)
进一步升级到嵌入空间:
分数(和,问)=f(在和,在问,P(我∣问))\text{Score}(E, Q) = f(\mathbf{v}_E, \mathbf{v}_Q, P(I|Q))
其中:
在和\mathbf{v}_E = 实体向量
在问\mathbf{v}_Q = 查询/意图向量
P(我∣问)P(I|Q) = 意图概率
实体图谱(KG):
向量化(Embedding):
每个实体 和我E_i 映射到向量 在和我\mathbf{v}_{E_i}
每个关系 拉jR_j映射到向量在拉j\mathbf{v}_{R_j}
形成语义空间中的向量图
概率建模:
每个边和节点附带概率 P(和∣我),P(我∣问)P(E|I), P(I|Q)
结合向量空间,用概率加权相似度预测最可能实体
Query → Intent → Entity → Answer 在概率语义空间中:
查询 Q → 转向意图向量 在我\mathbf{v}_I
结合用户上下文 在C\mathbf{v}_C → 更新意图概率 P(我∣问,C)P(I|Q,C)
搜索实体向量 在和\mathbf{v}_E → 计算匹配度
综合概率 → 排序答案
数学公式:
分数(和∣问,C)=∑我P(我∣问,C)⋅化学(在和,在我)\text{Score}(E|Q,C) = \sum_{I} P(I|Q,C) \cdot \cos(\mathbf{v}_E, \mathbf{v}_I)
语义理解更准确:向量表示捕捉语义相似度
概率推理更灵活:可以处理模糊意图和多种用户行为
可扩展到新实体:通过向量空间可以快速加入新实体
答案可直接生成:不依赖网页,只依赖实体和概率推理
你之前提出的 TSAI-SPR概率递推系统:
递推式问答生成 → 对应概率推理层
知识图谱闭环 → 对应实体图谱 + 属性 + 关系
概率计算用户意图 → 对应概率语义空间的 P(我∣问)P(I|Q)
也就是说:
可以直接用于:
AEO / GEO 优化
推荐系统
用户意图预测
内容生成
AI搜索正在从“网页索引 + 关键词匹配”转向:
核心是:实体成为基础单位,概率+向量空间成为推理引擎。