Tool calling, function calling, agents : les vraies différences

La terminologie autour de l'exécution adjacente aux LLM est véritablement confuse. Non pas parce que les ingénieurs manquent de rigueur, mais parce que trois communautés distinctes (chercheurs en ML, concepteurs d'API et équipes produit) ont colonisé les mêmes mots en même temps avec des sens différents. Ce glossaire trace une ligne nette entre chaque terme, vous donne du code qui rend la distinction concrète, et se termine par un guide de décision que vous pouvez réellement utiliser.

↳ tl;dr Le function calling est une sortie structurée, sans exécution. Le tool calling est du function calling avec un aller-retour. Les agents sont des systèmes qui planifient et se corrigent sur plusieurs étapes. Ci-dessous : définitions, code fonctionnel pour chacun, un tableau comparatif à 12 dimensions, un guide de décision, et les six phrases que vous entendrez dans chaque réunion client (avec ce qu'il faut clarifier).

Pourquoi la terminologie est cassée

Trois vocabulaires sont arrivés en même temps et ont pointé vers des choses qui se chevauchent. OpenAI a nommé son mode de sortie structurée « function calling » en juin 2023, ce qui impliquait immédiatement une exécution qui ne se produit pas. Anthropic a nommé la même primitive « tool use », confondant l'intention et l'exécution dans l'autre sens. La communauté produit s'est emparée du mot « agent », un terme au sens chargé de plusieurs décennies en recherche IA, pour le pointer sur n'importe quoi, d'un chatbot avec mémoire à une simple boucle d'appel d'outil.

Le coût pratique : dans une réunion, personne ne sait ce que l'autre entend par ces mots. Les ingénieurs adoptent l'interprétation la plus généreuse ; les chefs de produit adoptent la plus ambitieuse. Au moment où un build est cadré, « nous utilisons le function calling pour prendre des actions » peut désigner trois architectures différentes avec des coûts, des latences et des modes d'échec distincts.

La solution est de s'engager sur des définitions qui distinguent les trois par propriété structurelle, pas par marque fournisseur. C'est exactement ce que fait la suite de cet article.

Function calling

nom · primitive API · créé par OpenAI, juin 2023

Function calling

aussi : mode de sortie structurée, mode JSON

Un contrat de sortie structurée entre un appelant et un modèle de langage. L'appelant déclare une signature de fonction (nom, paramètres, types). Le modèle, au lieu de générer du texte libre, émet un objet JSON qui correspond à la signature. Aucune fonction n'est réellement exécutée. Le modèle produit une intention structurée ; l'appelant décide quoi en faire.

qui exécute

l'appelant, toujours

le modèle voit le résultat

seulement si vous le renvoyez

boucle ?

non, aller simple

état ?

aucun, requête sans état

planification ?

non

Utilisez quand

✓vous voulez du JSON structuré, pas du texte

✓un seul point de décision, une seule sortie

✓vous contrôlez ce qui se passe ensuite

✗vous avez besoin que le modèle enchaîne des actions

✗vous avez besoin du retour d'exécution

Le function calling est la plus ancienne et la plus étroite des trois primitives. Son seul rôle est de rendre fiable l'extraction de données structurées depuis le langage. Avant son existence, on demandait au modèle de « répondre en JSON » et on parsait ce qui sortait en espérant que ça tienne. Le function calling vous donne une sortie validée par schéma, sans ambiguïté de parsing.

Le terme a été créé par OpenAI lors de la publication de leur API en juin 2023 et a immédiatement semé la confusion parce qu'il implique une exécution. Rien ne s'exécute. Le modèle produit un dict qui ressemble à un appel de fonction. Vous décidez d'appeler la fonction, de la journaliser, ou de la jeter.

L'équivalent chez Anthropic est les blocs de contenu tool_use avec un retour tool_result : le même pattern, une terminologie différente. Les deux se réduisent à une seule affirmation. Le modèle déclare l'intention, l'appelant agit.

function_calling.py

import anthropic

client = anthropic.Anthropic()

# Declare the function signature. The model will emit this shape.
extract_order = {
    "name": "extract_order",
    "description": "Extract order details from a customer message",
    "input_schema": {
        "type": "object",
        "properties": {
            "product_id": {"type": "string"},
            "quantity":   {"type": "integer"},
            "shipping":   {"type": "string", "enum": ["standard", "express"]},
        },
        "required": ["product_id", "quantity"]
    }
}

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    tools=[extract_order],
    tool_choice={"type": "tool", "name": "extract_order"},
    messages=[{
        "role": "user",
        "content": "I need 3x SKU-7821, express please"
    }]
)

# Model emits structured intent. WE decide what to do with it.
tool_block = response.content[0]
order_data = tool_block.input
# }'product_id': 'SKU-7821', 'quantity': 3, 'shipping': 'express'}

# Nothing was executed. This is just a very reliable JSON extractor.
create_order(order_data)        # caller decides to run this

Tool calling

nom · pattern d'exécution · sous-ensemble des patterns agentiques

Tool calling

aussi : tool use, invocation d'outil

Une boucle fermée où le modèle déclare l'intention (via function calling), l'appelant exécute, et le résultat est renvoyé au modèle dans la même session. Le modèle peut observer le résultat et s'ajuster. Un appel d'outil est une itération de cette boucle. La caractéristique distinctive est l'aller-retour. Le modèle voit ce qui s'est passé.

qui exécute

l'appelant, mais le résultat revient

le modèle voit le résultat

oui, fonctionnalité centrale

boucle ?

oui, jusqu'à stop_reason: end_turn

état ?

dans la session uniquement

planification ?

implicite, chemin unique

Utilisez quand

✓le modèle a besoin de données réelles pour continuer

✓les résultats d'action influencent l'étape suivante

✓le workflow tient dans une chaîne d'outils linéaire

✗plusieurs agents doivent se coordonner

✗les branchements du workflow sont complexes

Le tool calling est du function calling avec une adresse de retour. Après que le modèle a émis un bloc tool use, vous exécutez la fonction et renvoyez un tool_result dans la conversation. Le modèle décide alors quoi faire ensuite : appeler un autre outil, demander une clarification, ou produire une réponse finale.

C'est le pattern qu'il vous faut pour les tâches mono-agent avec des effets de bord dans le monde réel. Interroger un enregistrement de base de données, appeler une API, lire un fichier, vérifier la météo. La boucle est implicite. Le modèle continue d'appeler des outils jusqu'à avoir de quoi répondre.

Le point de confusion : les gens disent « function calling » quand ils veulent dire « tool calling ». Techniquement, le function calling produit l'intention ; le tool calling est le cycle complet requête-exécution-retour. En pratique, quand quelqu'un dit « j'utilise le function calling », il veut dire tool calling. Demandez si le résultat revient au modèle.

tool_calling.py

import anthropic

client = anthropic.Anthropic()
messages = [{"role": "user", "content": "What's the current price of NVDA?"}]

# THE TOOL CALLING LOOP
while True:
    response = client.messages.create(
        model="claude-sonnet-4-6",
        max_tokens=1024,
        tools=[get_stock_price_tool],
        messages=messages
    )

    if response.stop_reason == "end_turn":
        break                    # model is done; extract final answer

    # Model wants to call a tool
    tool_uses = [b for b in response.content if b.type == "tool_use"]

    # Execute each tool call. WE run it, then return the result.
    tool_results = []
    for tu in tool_uses:
        result = execute_tool(tu.name, tu.input)  # actual execution
        tool_results.append({
            "type":        "tool_result",
            "tool_use_id": tu.id,
            "content":     result           # result goes BACK to model
        })

    # Feed result back. The model now knows what happened.
    messages += [
        {"role": "assistant", "content": response.content},
        {"role": "user",      "content": tool_results}
    ]

# Key difference from function calling: the model SAW the result.
final = extract_text(response.content)

Agents

nom · pattern architectural · définition contestée

Agent

aussi : agent IA, agent autonome, système agentique

Un système où un modèle de langage planifie, exécute et se corrige sur plusieurs étapes vers un objectif, avec un état persistant entre les tours. Les agents peuvent utiliser des outils (le tool calling en est souvent une composante), instancier des sous-agents, maintenir une mémoire et prendre des décisions de routage. La caractéristique distinctive est la poursuite autonome d'un objectif sur un horizon multi-étapes. Le modèle décide quoi faire ensuite, pas seulement comment répondre.

qui exécute

dirigé par le modèle, multi-étapes

le modèle voit le résultat

oui, et planifie à partir de lui

boucle ?

oui, jusqu'à l'atteinte de l'objectif

état ?

persistant, entre les tours

planification ?

oui, multi-étapes, adaptative

Utilisez quand

✓l'objectif nécessite plus de 3 à 4 appels d'outils

✓le chemin vers l'objectif n'est pas connu à l'avance

✓la récupération d'erreur doit être autonome

✓plusieurs spécialistes doivent se coordonner

✗la tâche est entièrement spécifiable comme un DAG

✗le budget de latence est serré

« Agent » est le mot le plus surchargé de l'écosystème. Un chatbot avec mémoire se fait appeler agent. Une simple boucle d'appel d'outil se fait appeler agent. La définition utile est plus étroite : un système où le LLM pilote la séquence d'exécution, pas seulement une étape isolée.

La différence structurelle avec le tool calling : un agent maintient un état entre les tours, peut réviser son plan quand un outil échoue, et peut instancier des sous-tâches ou d'autres agents. C'est la différence entre demander à quelqu'un de chercher un fait et lui demander de faire une recherche et rédiger un rapport. Le second implique des décisions sur la façon de procéder qui n'étaient pas spécifiées à l'avance.

Les agents sont le bon choix quand le chemin vers l'objectif est inconnu ou variable. Si vous pouvez écrire le workflow comme un organigramme fixe, vous voulez probablement du tool calling orchestré, pas un agent. Les agents échangent la prévisibilité contre l'adaptabilité. Comprenez ce compromis avant d'adopter ce pattern.

agent.py (simplified; real agents use LangGraph or similar)

from langgraph.graph import StateGraph, END
from typing import TypedDict, List

# STATE: persists across the entire agent run
class ResearchState(TypedDict):
    goal:       str
    plan:       List[str]    # agent generates this dynamically
    findings:   List[str]    # accumulates across turns
    iterations: int          # self-corrects if stuck
    done:       bool

# NODES: each is a model call that reads + writes state
def planner(state: ResearchState) -> ResearchState:
    # Model decides what to do next. Not pre-specified by the caller.
    plan = llm_plan(state["goal"], state["findings"])
    return {**state, "plan": plan}

def executor(state: ResearchState) -> ResearchState:
    # Runs tool calls determined by the planner, not hardcoded.
    results = [run_tool(step) for step in state["plan"]]
    return {**state,
            "findings": state["findings"] + results,
            "iterations": state["iterations"] + 1}

def evaluator(state: ResearchState) -> ResearchState:
    # Model self-assesses: is the goal met? Should I retry?
    done = llm_evaluate(state["goal"], state["findings"])
    return {**state, "done": done}

# GRAPH: model drives the control flow
graph = StateGraph(ResearchState)
graph.add_node("plan",     planner)
graph.add_node("execute",  executor)
graph.add_node("evaluate", evaluator)

# Conditional edge: agent decides whether to loop or finish
graph.add_conditional_edges("evaluate",
    lambda s: END if s["done"] or
              s["iterations"] >= 5 else "plan")

agent = graph.compile(checkpointer=MemorySaver())   # persistent state
result = agent.invoke({"goal": "research Q3 competitor pricing",
                         "findings": [], "iterations": 0})

Le function calling produit une intention structurée. Le tool calling produit des résultats observés. Les agents produisent une progression autonome. Les trois ne sont pas synonymes.

Comparaison côte à côte

La page unique à afficher au-dessus du tableau blanc lors de la revue d'architecture. Douze dimensions, trois colonnes, la réponse à la plupart des questions « attendez, lequel on fait exactement ? ».

dimension	function calling	tool calling	agent
`rôle principal`	extraction structurée	observer et réagir au monde	poursuivre un objectif de façon autonome
`exécution`	appelant uniquement	appelant exécute, résultat revient	dirigée par le modèle, multi-étapes
`boucle de feedback`	aucune	aller-retour unique	continue, adaptative
`état`	sans état	dans la session	persistant, avec checkpointing
`planification`	aucune	implicite	explicite, révisable
`latence`	la plus faible (1 appel)	moyenne (N appels)	la plus élevée (N appels + surcharge)
`prévisibilité`	la plus haute	moyenne	la plus basse
`périmètre adapté`	extraire, classer, valider	chercher, récupérer, poster, calculer	rechercher, orchestrer, décider
`mode d'échec`	non-concordance de schéma	erreur d'outil, dépassement de contexte	boucle infinie, plan halluciné
`mitigation`	validation de schéma	validation du résultat, retry	budget de confiance, harnais d'evals
`orchestrateur nécessaire ?`	non	rarement	presque toujours
`coût par invocation`	le moins cher	moyen	le plus cher

Guide de décision

Commencez par la primitive la plus simple qui satisfait l'exigence. Ne montez dans la pile de complexité que quand l'option plus simple ne peut structurellement pas faire le travail, pas simplement parce qu'elle exigerait un prompting plus soigneux.

Function calling

quand la tâche est de l'extraction ou de la classification

→Parser une commande en langage naturel en champs structurés

→Classer un ticket de support dans une catégorie de routage

→Extraire des entités d'un document (noms, dates, montants)

→Valider que la saisie utilisateur correspond à un schéma attendu

→Générer une config structurée à partir d'une description en prose

Tool calling

quand la tâche nécessite des données réelles ou des effets de bord

→Consulter un enregistrement de base de données et le résumer

→Vérifier la météo, puis recommander une activité

→Poster vers une API selon l'intention de l'utilisateur

→Calculer, puis expliquer le résultat

→Rechercher, récupérer et synthétiser jusqu'à 3 ou 4 sources

Agent

quand le chemin vers l'objectif est incertain ou long

→Faire des recherches sur un sujet à travers un nombre inconnu de sources

→Déboguer un système en exécutant des commandes et en interprétant les sorties

→Coordonner plusieurs spécialistes vers un livrable commun

→Gérer une tâche qui récupère de ses propres échecs

→Workflow longue durée avec points de contrôle humains

Aide-mémoire pour la réunion client

Quand quelqu'un dit l'une de ces choses, voici ce qu'il veut probablement dire et ce qu'il faut clarifier ou corriger. À utiliser dans les réunions où la terminologie est déjà devenue structurante.

ils disent

« Nous utilisons le function calling pour que le modèle cherche des informations et prenne des actions. »