Visual Question Answering using Deep Learning

Moulai, Azeddine

Please use this identifier to cite or link to this item: http://dspace.univ-bouira.dz:8080/jspui/handle/123456789/17942

Title:	Visual Question Answering using Deep Learning
Authors:	Moulai, Azeddine
Issue Date:	2024
Publisher:	Université de bouira AKLI MOHAND OULHADJ
Citation:	SCIENCE EXACTE
Abstract:	Le Visual Question Answering (VQA) dans le domaine de l’intelligence artificielle (IA) intègre la vision par ordinateur et le traitement du langage naturel pour développer des systèmes capables de répondre à des questions basées sur du contenu visuel. Les pro grès rapides de la recherche en IA ont considérablement élargi la complexité et la variété des données disponibles pour l’entraînement des modèles VQA. Ce volume croissant de données visuelles et la nature diverse des questions posées nécessitent des techniques so phistiquées pour atteindre des performances élevées. Les systèmes VQA ont un potentiel immense dans les applications réelles telles que l’assistance aux personnes malvoyantes, l’amélioration de l’interaction homme-machine et l’amélioration du support client au tomatisé. Cependant, développer des systèmes VQA efficaces reste un défi en raison de la nécessité d’une compréhension et d’une intégration précises des informations vi suelles et textuelles. Les architectures basées sur les transformateurs, avec leurs mécan ismes d’attention, ont révolutionné le traitement du langage naturel et font désormais des avancées significatives dans la vision par ordinateur. Ces modèles excellent à capturer les dépendances et les relations au sein des données, ce qui les rend bien adaptés aux tâches nécessitant une compréhension des images et du texte.
URI:	http://dspace.univ-bouira.dz:8080/jspui/handle/123456789/17942
Appears in Collections:	Mémoires Master

Files in This Item:

File	Description	Size	Format
039 GSI.pdf		6,21 MB	Adobe PDF	View/Open

Show full item record