Reasoning Models and Chinese Models

Опубликовано: 01 Январь 1970
на канале: Trelis Research

1,634

🛠 Tools (Fine-tuning, Vision, Audio, Inference): https://Trelis.com
💡 Consulting (Technical Assistance OR Market Insights): https://forms.gle/2VXzrBzpvm1BmG6e7
🤝 Join the Trelis Team: https://trelis.com/developer-collabor...
💸 Grants Program: https://trelis.com/trelis-ai-grants/
📧 Newsletter: https://trelis.substack.com
📸 Thumbnail made with this tutorial: • Fine Tune Flux Diffusion Models with ...

VIDEO Links:
ARC Prize: https://arcprize.org/blog/oai-o3-pub-...
Trelis video on Deepseek v3: • How Deepseek v3 made Compute and Expo...
Reasoning Models Tested: o1, R1-Lite (Deepseek), QwQ, Gemini Flash Thinking
Qwen Process Reward Model: https://huggingface.co/Qwen/Qwen2.5-M...

TIMESTAMPS:
00:00:00 - Introduction to reasoning models and their significance, particularly those from Chinese labs
00:09:18 - Detailed explanation of how reasoning models work, including the concept of reasoning traces and verification
00:22:26 - Discussion of the emergence of strong models from Chinese companies (DeepSeek, Qwen, Minimax) and their technical achievements