[1]

L. Ngo Dinh, H. Le Ngoc, and L. Quoc Phan, “OHYEAH AT VLSP2022-EVJVQA CHALLENGE: A JOINTLY LANGUAGE-IMAGE MODEL FOR MULTILINGUAL VISUAL QUESTION ANSWERING”, JCC, vol. 39, no. 4, p. 381–391, Dec. 2023.