Xây dựng hệ thống rút trích các nội dung chính của văn bản khoa học tiếng Việt dựa trên cấu trúc

Authors

  • Tạ Nguyễn Đại học Lạc Hồng
  • Vũ Đức Lung Đại học Công nghệ thông tin - ĐHQG TP.HCM

DOI:

https://doi.org/10.15625/0866-708X/52/3/3232

Abstract

Bài báo trình bày cách thức rút trích các câu có nội dung quan trọng trong các văn bản khoa học tiếng Việt dựa trên cấu trúc. Hệ thống rút trích được xây dựng dựa trên một quy trình chặt chẽ mà bài báo đề xuất với việc áp dụng nhiều phương pháp khác nhau trong việc tính toán độ quan trọng thông tin của câu. Kết quả thử nghiệm cho thấy kết hợp phương pháp độ đo cục bộ và toàn cục (TF.IDF) với cách đánh giá câu theo cách cộng dồn trọng số từ cho kết quả tốt nhất. Bước đầu thử nghiệm trên các bài báo khoa học và toàn văn báo cáo thuộc lĩnh vực Công nghệ thông tin đã cho những kết quả có độ chính xác cao so với yêu cầu.

Downloads

Download data is not yet available.

Author Biographies

Tạ Nguyễn, Đại học Lạc Hồng

Giảng viên

Vũ Đức Lung, Đại học Công nghệ thông tin - ĐHQG TP.HCM

Trưởng khoa Kỹ thuật máy tính, Đại học Công nghệ thông tin, D9HQG TP.HCM

Published

2014-07-02

How to Cite

Nguyễn, T., & Lung, V. Đức. (2014). Xây dựng hệ thống rút trích các nội dung chính của văn bản khoa học tiếng Việt dựa trên cấu trúc. Vietnam Journal of Science and Technology, 52(3), 269. https://doi.org/10.15625/0866-708X/52/3/3232

Issue

Section

Articles