ThuyNga1991999
New Member
- Bài viết
- 13
- Điểm tương tác
- 0
- Điểm
- 1
- Tuổi
- 26
Mình từng bị “ngợp” khi nghe hỏi llm là gì, nhưng hiểu đơn giản: nó là mô hình ngôn ngữ lớn (thường dựa trên Transformer) được pre-train trên dữ liệu văn bản quy mô web để học cách dự đoán/tiếp tục chuỗi từ, rồi fine-tune hoặc instruction-tune cho các bài toán như hỏi–đáp, tóm tắt, viết nội dung. Điểm hay là LLM không chỉ “nhớ câu”, mà học được các mẫu ngôn ngữ và suy luận ngữ cảnh ở mức khá mạnh, nên mới dùng làm lõi cho chatbot, trợ lý viết, phân tích tài liệu…