AI专项大模型工程面试题

对比使用过哪些主流大模型?你们项目中最终选用了哪个模型?为什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型能力评测指标有哪些?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型部署有哪些主流方案?vLLM、TGI、llama.cpp、SGLang 实际项目里怎么选?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

MoE 混合专家模型是什么?DeepSeek V3、Qwen 为什么用 MoE?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型为什么会出现幻觉?怎么缓解?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

什么是 CoT?为啥效果好?它有什么缺点或局限性?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

如何写好 Prompt?分享下 Prompt 工程实践经验?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型量化是什么?INT8/INT4/AWQ/GPTQ 怎么选?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

KV Cache 是什么?Prompt Caching 的原理是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型的参数:温度值、Top-P、Top-K 分别是什么?各个场景下的最佳设置是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型生成文本时的解码策略有哪些?贪心、Beam Search、采样分别什么时候用?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型的 DPO 和 PPO 的区别是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

SFT 之后还有哪些 Post-Training?RLHF、DPO、GRPO、拒绝采样什么关系?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

请讲一下 LoRA 技术,除了减少参数量,它还有哪些优点?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型微调的方案有哪些?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

什么是 Scaling Law?大模型的「涌现能力」是怎么回事?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型是怎么训练出来的?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

什么是大模型项目的分词器?原理是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

大模型的位置编码是干什么用的?sin/cos、RoPE、ALiBi 有什么区别?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

多头注意力(MHA)有哪些局限?MQA、GQA、Flash Attention 怎么解决?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. 消息队列价值是削峰填谷、异步解耦和流量缓冲,但代价是复杂度、一致性和可观测性要求上升。
  2. 可靠性要从生产者确认、Broker 持久化、副本机制、消费者提交 offset、幂等消费和补偿重试一起回答。
  3. 顺序性通常要求同一业务 key 进入同一分区/队列,消费者单线程或按 key 串行处理。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 消息队列价值是削峰填谷、异步解耦和流量缓冲,但代价是复杂度、一致性和可观测性要求上升。 2. 可靠性要从生产者确认、Broker 持久化、副本机制、消费者提交 offset、幂等消费和补偿重试一起回答。 3. 顺序性通常要求同一业务 key 进入同一分区/队列,消费者单线程或按 key 串行处理。 容易被追问: - 消息重复消费怎么做幂等? - 积压后如何扩容和恢复? 注意事项: - 不要只说 MQ 能解耦,要说明失败、重复、乱序和积压如何处理。
AI专项大模型工程面试题

讲讲 Transformer 架构基本原理?Encoder 和 Decoder 是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项大模型工程面试题

什么是大语言模型?和传统 NLP 模型有什么区别?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

有没有用过大模型的网关框架?网关层解决了什么问题?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. 分布式题要先说明目标:可用性、扩展性、一致性、延迟和成本之间的取舍。
  2. 一致性可以用本地消息表、事务消息、TCC、Saga、幂等和对账补偿;不是所有场景都需要强一致。
  3. 限流熔断要结合指标:QPS、错误率、延迟、资源水位,并提供降级返回和恢复策略。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 分布式题要先说明目标:可用性、扩展性、一致性、延迟和成本之间的取舍。 2. 一致性可以用本地消息表、事务消息、TCC、Saga、幂等和对账补偿;不是所有场景都需要强一致。 3. 限流熔断要结合指标:QPS、错误率、延迟、资源水位,并提供降级返回和恢复策略。 容易被追问: - 跨库分页怎么做? - 雪花算法时钟回拨怎么办? 注意事项: - 不要上来就套方案,要先说业务一致性等级和失败边界。
AI专项LLM 工具调用面试题

为什么要用 WebRTC 协议?它和 WebSocket 在 AI 对话流中的核心差异是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

说说 WebSocket 和 SSE 通信的区别及局限性?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

MCP 协议通常采用什么通信方式?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

什么是 A2A 协议?它和 MCP 协议的区别是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

Function Calling、Skill、MCP 这三个有什么区别?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。
  2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。
  3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。 2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。 3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。 容易被追问: - TIME_WAIT 为什么需要等待? - HTTPS 握手过程是什么? 注意事项: - 不要只背 OSI 七层,要落到 TCP/HTTP 的真实问题。
AI专项LLM 工具调用面试题

MCP 和 Agent Skill 的区别是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

Skill 是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

为什么有些特定的推理模型不支持 MCP 协议?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

Function Calling 也属于工具调用,请问什么场景下使用 Function Calling,什么场景下使用 MCP?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。
  2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。
  3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。 2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。 3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。 容易被追问: - TIME_WAIT 为什么需要等待? - HTTPS 握手过程是什么? 注意事项: - 不要只背 OSI 七层,要落到 TCP/HTTP 的真实问题。
AI专项LLM 工具调用面试题

MCP 和 Function Calling 有什么区别?有没有实际跑过 MCP?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。
  2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。
  3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。 2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。 3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。 容易被追问: - TIME_WAIT 为什么需要等待? - HTTPS 握手过程是什么? 注意事项: - 不要只背 OSI 七层,要落到 TCP/HTTP 的真实问题。
AI专项LLM 工具调用面试题

MCP 由哪几部分组成?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

什么是 MCP(模型上下文协议)?讲讲它的核心内容?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

大模型的 Function Call 能力是怎么训练出来的?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。
  2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。
  3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。 2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。 3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。 容易被追问: - TIME_WAIT 为什么需要等待? - HTTPS 握手过程是什么? 注意事项: - 不要只背 OSI 七层,要落到 TCP/HTTP 的真实问题。
AI专项LLM 工具调用面试题

LLM 是如何学会调用外部工具的?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项LLM 工具调用面试题

什么是 Function Calling?原理是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。
  2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。
  3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。 2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。 3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。 容易被追问: - TIME_WAIT 为什么需要等待? - HTTPS 握手过程是什么? 注意事项: - 不要只背 OSI 七层,要落到 TCP/HTTP 的真实问题。
AI专项RAG 面试题

在实际落地中,你觉得 RAG 最难的地方是哪里?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

RAG 知识库如何实现动态与持续更新?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

怎么量化你的 RAG 效果?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

如何规避 RAG 系统中大模型的幻觉?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

在什么场景下,你会选择使用图数据库来增强传统的向量检索?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

了解哪些更复杂的 RAG 范式?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

RAG 检索优化策略有哪些?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

什么是多路召回?具体怎么做?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

如何润色用户的 Query(Query Rewrite)?目的是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

请你介绍一下向量检索和关键词检索的区别?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

你使用 RAG 给大模型一个输入,系统是怎样的工作流程?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

讲讲你用的向量数据库?数据量级是多大?性能如何?遇到过性能瓶颈吗?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

什么是向量数据库?有没有做过向量数据库的对比选型?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

Embedding 有哪几种算法你了解过吗?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

在 RAG 中 Embedding 究竟是什么?如何选择和评估一个 Embedding 模型?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

怎么规避语义被切割掉的问题?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

RAG 中的文档是怎么存的?粒度是多大?详细说说文档切割(Chunking)策略?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

相比直接微调 LLM,RAG 解决了什么问题?微调和 RAG 各自的优劣势是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

大模型的 RAG 主要用来解决什么问题?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项RAG 面试题

什么是 RAG?详细描述一个完整 RAG 系统的详细工作流程?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

如何设计多 Agent 的协作与动态切换机制?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

讲讲 Agent 的反思机制?为什么要用反思?具体怎么实现?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

如何赋予 LLM 规划能力?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

在工程实践中,为什么有时候选择「手搓」Agent,而不是直接用成熟框架?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

Agent 记忆压缩通常有哪些方法?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

说说 Single-Agent 和 Multi-Agent 的设计方案?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

什么是 Multi-Agent?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

Agent 的长短期记忆系统怎么做的?记忆是怎么存的?粒度是多少?怎么用的?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

请你介绍一下 AI Agent 的记忆机制,并说明在实际开发中应该如何设计记忆模块?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

复杂任务怎么做的任务拆分?为什么要拆分?效果如何提升?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

ReAct、Plan-and-Execute、Reflection 三种范式有什么核心区别?实际项目中该如何选型?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。
  2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。
  3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 计算机基础题要先给定义,再讲关键机制,最后联系工程场景。 2. 进程线程可以从资源隔离、调度单位、上下文切换、通信方式和故障影响对比。 3. 网络题要覆盖连接建立、可靠性、拥塞/流量控制、状态码、长连接、TLS 和常见性能优化。 容易被追问: - TIME_WAIT 为什么需要等待? - HTTPS 握手过程是什么? 注意事项: - 不要只背 OSI 七层,要落到 TCP/HTTP 的真实问题。
AI专项Agent 面试题

Agent 推理模式有哪些?ReAct 是啥?具体是怎么实现的?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

了解哪些其他的 Agent 设计范式?Agent 和 Workflow 的区别是什么?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

Workflow,Agent,Tools 这三个的概念和区别介绍一下?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

Agent 的基本架构由哪些核心组件构成?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项Agent 面试题

什么是 Agent?与大模型有什么本质不同?

AI专项大模型AgentRAG大厂高频面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项快手 后端组件

了解过 es 分词器有哪些?

面试AI专项公司面经互联网大厂快手
参考答案
  1. 先明确题目里的核心概念:了解过 es 分词器有哪些。面试回答要先给定义,再说明原理或机制。
  2. 补充工程落地点:它解决什么问题、适合什么场景、有什么代价,以及线上如何监控或排查。
  3. 最后主动延伸到边界条件、失败场景和与相近方案的对比,体现不是只背结论。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 先明确题目里的核心概念:了解过 es 分词器有哪些。面试回答要先给定义,再说明原理或机制。 2. 补充工程落地点:它解决什么问题、适合什么场景、有什么代价,以及线上如何监控或排查。 3. 最后主动延伸到边界条件、失败场景和与相近方案的对比,体现不是只背结论。 容易被追问: - 如果放到你的项目里,你会如何设计和验证? - 这个方案的瓶颈和替代方案是什么? 注意事项: - 不要只给一句定义,面试官通常会继续追问原理、边界和工程实践。 - 不要忽略适用场景和代价,很多题考察的是取舍能力。
AI专项腾讯 算法工程师

我的C++神功大成竟然一句没问,一些异构并行计算的东西也没咋问,几乎都是研究相关的问题一直往深了问到不会为止,面试官知识面相当的广,没有问什么太基础的诸如深度学习相关的内容,和网上面经不太一样,晚上面完第二天中午接到约复试的电话。

AI专项公司面经腾讯算法工程师面试
参考答案
  1. 算法题回答先复述问题和约束,再说明核心思路、状态定义或数据结构选择,最后给复杂度和边界情况。
  2. 如果是链表常用快慢指针、虚拟头节点;树题常用递归、层序遍历;动态规划要讲状态、转移、初始化和遍历顺序。
  3. 面试时要主动说测试用例:空输入、单元素、重复值、极值和不合法参数。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 算法题回答先复述问题和约束,再说明核心思路、状态定义或数据结构选择,最后给复杂度和边界情况。 2. 如果是链表常用快慢指针、虚拟头节点;树题常用递归、层序遍历;动态规划要讲状态、转移、初始化和遍历顺序。 3. 面试时要主动说测试用例:空输入、单元素、重复值、极值和不合法参数。 容易被追问: - 能否把空间复杂度优化? - 如果数据量很大怎么处理? 注意事项: - 不要直接写代码不讲思路。 - 不要漏掉时间复杂度和边界条件。
AI专项腾讯 算法工程师

开放世界类游戏如何做RL?不懂什么是开放世界类游戏,遂反问,对方也不知道怎么解释,双方鸡同鸭讲,妨碍我面试的竟然是游戏打的不够多。。。。

AI专项公司面经腾讯算法工程师面试
参考答案
  1. 算法题回答先复述问题和约束,再说明核心思路、状态定义或数据结构选择,最后给复杂度和边界情况。
  2. 如果是链表常用快慢指针、虚拟头节点;树题常用递归、层序遍历;动态规划要讲状态、转移、初始化和遍历顺序。
  3. 面试时要主动说测试用例:空输入、单元素、重复值、极值和不合法参数。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 算法题回答先复述问题和约束,再说明核心思路、状态定义或数据结构选择,最后给复杂度和边界情况。 2. 如果是链表常用快慢指针、虚拟头节点;树题常用递归、层序遍历;动态规划要讲状态、转移、初始化和遍历顺序。 3. 面试时要主动说测试用例:空输入、单元素、重复值、极值和不合法参数。 容易被追问: - 能否把空间复杂度优化? - 如果数据量很大怎么处理? 注意事项: - 不要直接写代码不讲思路。 - 不要漏掉时间复杂度和边界条件。
AI专项腾讯 算法工程师

Model-based RL了解吗?事后感觉面试官是想听我说MCTS(因为阿尔法狗和王者荣耀AI貌似都用到了),可惜当时没想到这一层,想到了也不会,于是另辟蹊径从以前做自动驾驶的层面介绍了下MPC模型预测控制,可以认为MPC是model-given的纯动态规划RL吧,面试官也认可这一看法。

AI专项公司面经腾讯算法工程师面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项腾讯 算法工程师

问RL项目,目前我RL只有基于模仿学习的一个算法还在做,没啥实质性成果,因此就讲了一下以前基于carla尝试做的自动驾驶DQN,对方来了兴趣细问这个任务的状态、动作空间,模型的结构、遇到的问题等,两年前做的,东西也不难,大概答了一下没什么错漏。开始问RL相关了,我已经一年没接触强化学习了,最近才开始慢慢看模仿学习,赶面试前一天总结了一下相关内容就面了。

AI专项公司面经腾讯算法工程师面试
参考答案
  1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。
  2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。
  3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. AI 工程题要把模型能力、数据链路、推理服务、评测和成本一起讲,避免只谈调 prompt。 2. RAG 类问题说明切分、向量化、召回、重排、上下文组装、生成和评测;幻觉治理靠检索质量、引用约束、拒答策略和离线评测。 3. Agent 类问题关注工具调用、状态管理、任务编排、超时重试、权限边界和可观测性。 容易被追问: - 如何评估 RAG 是否真的变好? - 工具调用失败如何补偿? 注意事项: - 不要把 Demo 能跑当成生产可用,要说明延迟、成本、权限和失败兜底。
AI专项字节跳动 AI Lab 算法工程师

看面经说字节跳动的面试很重视算法,阿里很重视底层,果然没错,我第一次面字节,就被吓到了,全程只有三个算法题(除了自我介绍)。

AI专项公司面经字节跳动AI Lab 算法工程师面试
参考答案
  1. 算法题回答先复述问题和约束,再说明核心思路、状态定义或数据结构选择,最后给复杂度和边界情况。
  2. 如果是链表常用快慢指针、虚拟头节点;树题常用递归、层序遍历;动态规划要讲状态、转移、初始化和遍历顺序。
  3. 面试时要主动说测试用例:空输入、单元素、重复值、极值和不合法参数。
展开完整答法
这题可以按「结论 -> 原理 -> 场景 -> 风险」来答,重点放在AI 工程里的可落地理解。 答题要点: 1. 算法题回答先复述问题和约束,再说明核心思路、状态定义或数据结构选择,最后给复杂度和边界情况。 2. 如果是链表常用快慢指针、虚拟头节点;树题常用递归、层序遍历;动态规划要讲状态、转移、初始化和遍历顺序。 3. 面试时要主动说测试用例:空输入、单元素、重复值、极值和不合法参数。 容易被追问: - 能否把空间复杂度优化? - 如果数据量很大怎么处理? 注意事项: - 不要直接写代码不讲思路。 - 不要漏掉时间复杂度和边界条件。