DEEPSEEK – 我家Ai智障

1 月

2026

610 0

GRPO: DeepSeek-R1

在推理能力方面，OpenAI 的 o1 系列模型（OpenAI, 2024b）率先通过延长思维链（Chain-of-Thought）推理过程的长度实现推理时扩展，在数学、编程、科学推理等多种推理任务中...