Mình từng bị “ngợp” khi nghe hỏi llm là gì, nhưng hiểu đơn giản: nó là mô hình ngôn ngữ lớn (thường dựa trên Transformer) được pre-train trên dữ liệu văn bản quy mô web để học cách dự đoán/tiếp tục chuỗi từ, rồi fine-tune hoặc instruction-tune cho các bài toán như hỏi–đáp, tóm tắt, viết nội...