Chuyển tới nội dung chính

5 bài viết được gắn thẻ "Prompt Engineering"

Kỹ thuật thiết kế và tối ưu hóa lời nhắc để cải thiện hiệu suất chatbot.

Xem tất cả thẻ

Prompt Engineering Claude A-Z: Hướng Dẫn Toàn Diện Từ Anthropic

· 9 phút để đọc
Nguồn: Bình dân học AI

Bài viết này cung cấp hướng dẫn toàn diện về kỹ thuật prompt cho mô hình Claude của Anthropic. Prompt engineering được nhấn mạnh là phương pháp hiệu quả 🚀, tiết kiệm chi phí 💰 và linh hoạt 🔄 hơn so với fine-tuning.

Nguyên Tắc Tạo Prompt 'Long Chain-of-Thought' (Long CoT) Hiệu Quả Cho LLMs

· 6 phút để đọc
Nguồn: Bình dân học AI

Chain-of-Thought (CoT) đã nổi lên như một phương pháp đột phá để tăng cường khả năng lý luận của Large Language Models (LLM), đặc biệt trong các tác vụ phức tạp đòi hỏi lý luận đa bước. Nghiên cứu khoa học "Demystifying Long Chain-of-Thought Reasoning in LLMs" đã làm sáng tỏ cách LLM phát triển khả năng lý luận mở rộng thông qua Supervised Fine-Tuning (SFT) và Reinforcement Learning (RL), nhấn mạnh tầm quan trọng của dữ liệu Long CoT. Bài viết này tổng hợp các nguyên tắc cốt lõi từ nghiên cứu này và các nguồn khác để cung cấp hướng dẫn toàn diện về cách tạo Long CoT hiệu quả.

Case Study: Quy Trình Prompt Engineering Cho Người Mới Bắt Đầu (Ví Dụ: Viết Blog Du Lịch)

· 7 phút để đọc
Nguồn: Bình dân học AI

Bạn là một blogger về du lịch muốn tạo ra các bài viết blog hấp dẫn về các điểm đến du lịch nổi tiếng ở Việt Nam. Bạn muốn sử dụng LLM để viết nhanh hơn và hiệu quả hơn, nhưng vẫn đảm bảo chất lượng nội dung. Sau đây là cách áp dụng quy trình Prompt Engineering (xem hình) để đạt được mục tiêu này.

DeepSeek-R1: GRPO - Kỷ Nguyên LLM Tự Chủ Reasoning, Thay Thế Prompt Engineering

· 8 phút để đọc
Nguồn: Bình dân học AI

DeepSeek-R1 không chỉ gây ấn tượng bởi khả năng reasoning vượt trội mà còn bởi cách tiếp cận huấn luyện hoàn toàn mới, tập trung vào cơ chế GRPO (Group Relative Policy Optimization). GRPO không chỉ tối ưu hóa mô hình thông qua RL mà còn tự động hóa hàng loạt các kỹ thuật prompt vốn được coi là thiết yếu. Bài viết này sẽ đi sâu vào cơ chế hoạt động của DeepSeek-R1, khám phá cách RL – thông qua GRPO – đang mở ra một paradigm mới cho LLM reasoning, nơi prompt engineering dần trở nên lỗi thời. ⏳