NCKH.SV So sánh hiệu năng các mô hình ngôn ngữ lớn trí tuệ nhân tạo trong trả lời câu hỏi thường gặp về nha khoa trẻ em
PDF Download: 1 View: 0

Tóm tắt

Sức khỏe răng miệng trẻ em là một thành phần quan trọng của sức khỏe toàn thân, ảnh hưởng trực tiếp đến ăn nhai, phát âm, thẩm mỹ, tăng trưởng, chất lượng cuộc sống và sự phát triển tâm lý – xã hội của trẻ. Các vấn đề thường gặp như sâu răng sớm ở trẻ em, đau răng, viêm nướu, chấn thương răng, mọc răng, thói quen răng miệng bất lợi, sử dụng fluor, chế độ ăn nhiều đường hoặc chăm sóc răng miệng không đúng cách vẫn là những mối quan tâm phổ biến của phụ huynh. Trong bối cảnh đó, nhu cầu được tư vấn nhanh chóng, dễ hiểu và phù hợp với từng tình huống cụ thể ngày càng gia tăng. Trước đây, phụ huynh thường lựa chọn đưa trẻ đến cơ sở nha khoa để được khám và tư vấn trực tiếp. Tuy nhiên, trong những năm gần đây, Internet, mạng xã hội, các diễn đàn, hội nhóm trực tuyến và gần đây là các công cụ trí tuệ nhân tạo đã trở thành những nguồn thông tin được phụ huynh sử dụng thường xuyên. Sự thay đổi này đặt ra nguy cơ về chất lượng, độ chính xác và tính an toàn của các nội dung y tế được cung cấp.

Sự phát triển của Cách mạng Công nghiệp 4.0 đã phổ biến các mô hình ngôn ngữ lớn (ChatGPT, Gemini, Claude) như một nguồn tham khảo y tế trực tuyến [1]. Các mô hình này phản hồi nhanh bằng ngôn ngữ tự nhiên, dễ hiểu và có tính cá nhân hóa cao, mang lại sự thuận tiện lớn cho phụ huynh [2]. Các câu hỏi đòi hỏi phản hồi phải tuyệt đối chính xác và phù hợp với từng độ tuổi, lâm sàng. Bởi vì trẻ em là đối tượng nhạy cảm, do đó việc tư vấn sai về dùng thuốc hoặc trì hoãn thăm khám có thể dẫn đến những hậu quả bất lợi nghiêm trọng.

Trên thế giới, các mô hình ngôn ngữ lớn (LLM) đã được nghiên cứu rộng rãi trong y tế và nha khoa để trả lời chuyên môn, hỗ trợ giáo dục, tóm tắt dữ liệu và truyền thông sức khỏe.  Dù có khả năng truyền thông sức khỏe và giải thích thông tin dễ hiểu, các mô hình ngôn ngữ lớn (LLMs) vẫn bộc lộ nhiều hạn chế nghiêm trọng như tạo thông tin sai lệch, thiếu nhất quán và không nhận diện được các tình huống khẩn cấp. Đặc biệt trong nha khoa trẻ em – lĩnh vực đòi hỏi độ chính xác lâm sàng cực kỳ nghiêm ngặt, LLMs vẫn chưa thể phân tích đáng tin cậy các dữ liệu hình ảnh chuyên sâu như phim X-quang hay CBCT, khiến chúng không thể thay thế vai trò chẩn đoán và điều trị của bác sĩ. Do đó, việc phụ huynh tự ý sử dụng các mô hình này mà không có sự giám sát của nhân viên y tế sẽ dẫn đến nguy cơ cao hiểu sai chỉ dẫn, áp dụng sai khuyến nghị hoặc trì hoãn việc đưa trẻ đi khám trực tiếp. [3]

Tại Việt Nam, các nghiên cứu đánh giá hiệu năng của mô hình ngôn ngữ lớn trong nha khoa trẻ em còn rất hạn chế. Đây là lĩnh vực đặc thù về bệnh lý, tâm lý trẻ, liều lượng thuốc và dự phòng. Khi phụ huynh dùng AI để hỏi các vấn đề thực tế thì câu trả lời không chỉ cần chính xác, dễ hiểu mà phải đảm bảo an toàn tuyệt đối và khuyến khích đưa trẻ đi khám trực tiếp khi cần thiết. Nghiên cứu và so sánh hiệu năng của các mô hình ngôn ngữ lớn (LLM) trong nha khoa trẻ em mang lại ý nghĩa khoa học quan trọng. Đề tài cung cấp dữ liệu thực nghiệm về độ chính xác, tính đầy đủ, nhất quán và mức độ an toàn của AI trong một lĩnh vực chuyên sâu. Kết quả này vừa làm cơ sở xây dựng bộ tiêu chí đánh giá năng lực LLM khi tư vấn răng miệng trẻ em, vừa giúp nhận diện các mảng nội dung AI trả lời tốt hoặc dễ sai lệch, từ đó định hướng cải thiện công cụ trong tương lai [4], [5], [6].

Về mặt thực tiễn, nghiên cứu giúp phụ huynh tiếp cận thông tin nha khoa trẻ em an toàn hơn, đồng thời hỗ trợ y bác sĩ và nhà giáo dục nhận diện tiềm năng lẫn giới hạn của AI trong truyền thông và đào tạo. Nếu được kiểm soát chuyên môn dựa trên bằng chứng, AI sẽ là công cụ đắc lực giúp chuẩn hóa nội dung tư vấn, giảm tải công việc và nâng cao trải nghiệm người bệnh mà không thay thế vai trò của bác sĩ [7]. Xuất phát từ nhu cầu thực tiễn và khoảng trống nghiên cứu trong nước, chúng tôi thực hiện đề tài: “So sánh hiệu năng các mô hình ngôn ngữ lớn trí tuệ nhân tạo trong trả lời câu hỏi thường gặp về nha khoa trẻ em” nhằm hai mục tiêu:

1. Đánh giá độ chính xác và tính nhất quán của các câu trả lời do các mô hình ngôn ngữ lớn tạo ra.

2. Đánh giá chất lượng thông tin và độ tin cậy của các mô hình ngôn ngữ lớn trên.

PDF Download: 1 View: 0