Towards Evaluating Large Language Models for Graph Query Generation

Munir, Siraj; Aldini, Alessandro

doi:10.1007/978-3-031-90341-0_3

Large Language Models (LLMs) are revolutionizing the landscape of Generative Artificial Intelligence (GenAI), with innovative LLM-backed solutions emerging rapidly. However, when applied to database technologies, specifically query generation for graph databases and Knowledge Graphs (KGs), LLMs still face significant challenges. While research on LLM-driven query generation for Structured Query Language (SQL) exists, similar systems for graph databases remain underdeveloped. This paper presents a comparative study addressing the challenge of generating Cypher queries - a powerful language for interacting with graph databases - using open-access LLMs. We rigorously evaluate several LLM agents (OpenAI ChatGPT 4o, Claude Sonnet 3.5, Google Gemini Pro 1.5, and a locally deployed Llama 3.1 8B) using a designed few-shot learning prompt and Retrieval Augmented Generation (RAG) backed by Chain-of-Thoughts (CoT) reasoning. Our empirical analysis of query generation accuracy reveals that Claude Sonnet 3.5 outperforms its counterparts in this specific domain. Further, we highlight promising future research directions to address the identified limitations and advance LLM-driven query generation for graph databases.

Towards Evaluating Large Language Models for Graph Query Generation

Munir, Siraj;Aldini, Alessandro

2025

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				2025
			
	ISBN
	
				9783031903403
9783031903410
			
	Appare nelle tipologie:
	
				4.1 Contributo Atti di Convegno (Proceeding)

File in questo prodotto:

File	Dimensione	Formato
siraj_CSCI2024_paper.pdf solo utenti autorizzati Tipologia: Versione editoriale Licenza: Copyright (tutti i diritti riservati) Dimensione 1.06 MB Formato Adobe PDF Visualizza/Apri Richiedi una copia	1.06 MB	Adobe PDF	Visualizza/Apri Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11576/2755811

Towards Evaluating Large Language Models for Graph Query Generation

Munir, Siraj;Aldini, Alessandro

2025

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

Citazioni

social impact

Towards Evaluating Large Language Models for Graph Query Generation

Munir, Siraj;Aldini, Alessandro

2025

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Informazioni

Citazioni

social impact

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)