Xây dựng hệ thống rút trích các nội dung chính của văn bản khoa học tiếng Việt dựa trên cấu trúc

Tạ Nguyễn, Vũ Đức Lung
Author affiliations

Authors

  • Tạ Nguyễn Đại học Lạc Hồng
  • Vũ Đức Lung Đại học Công nghệ thông tin - ĐHQG TP.HCM

DOI:

https://doi.org/10.15625/0866-708X/52/3/3232

Abstract

Bài báo trình bày cách thức rút trích các câu có nội dung quan trọng trong các văn bản khoa học tiếng Việt dựa trên cấu trúc. Hệ thống rút trích được xây dựng dựa trên một quy trình chặt chẽ mà bài báo đề xuất với việc áp dụng nhiều phương pháp khác nhau trong việc tính toán độ quan trọng thông tin của câu. Kết quả thử nghiệm cho thấy kết hợp phương pháp độ đo cục bộ và toàn cục (TF.IDF) với cách đánh giá câu theo cách cộng dồn trọng số từ cho kết quả tốt nhất. Bước đầu thử nghiệm trên các bài báo khoa học và toàn văn báo cáo thuộc lĩnh vực Công nghệ thông tin đã cho những kết quả có độ chính xác cao so với yêu cầu.

Downloads

Download data is not yet available.

Published

02-07-2014

How to Cite

[1]
T. Nguyễn and V. Đức Lung, “Xây dựng hệ thống rút trích các nội dung chính của văn bản khoa học tiếng Việt dựa trên cấu trúc”, Vietnam J. Sci. Technol., vol. 52, no. 3, pp. 269–280, Jul. 2014.

Issue

Section

Articles