Huit fonctionnalités. Un seul espace de travail cohérent.
Chaque fonctionnalité repose sur la même brique : la citation vérifiée. Cherchez un article, ouvrez-le, citez-le, référencez-le, surveillez-le, validez-le. Une même provenance suit la citation, de PubMed jusqu'à votre manuscrit.
Citations vérifiées.
Avant d'atteindre votre document, chaque citation est rapprochée par hachage d'une zone précise du PDF source, ancrée à la page. Pas de citation, pas d'affirmation.
À la récupération, Docling isole une zone de citation ancrée à la page. La citation produite par l'agent y est confrontée mot à mot. Tout écart est rejeté avant la synthèse. Le hachage et l'horodatage sont conservés aux côtés de la citation, dans votre Markdown.
“the risk of worsening heart failure or death from cardiovascular causes was lower among those who received dapagliflozin”
Chaînage de citations.
Remontez références et articles citants sur deux niveaux. Reclassez avec MedCPT. À partir d'un seul article d'amorce, obtenez un graphe de travail de 47 nœuds.
Le Rédacteur de revue de littérature lance graph.expand sur le réseau de citations issu de PubMed. Chaque nœud est reclassé avec MedCPT-Article au regard de votre question ; ceux qui passent sous le seuil sont écartés. Le journal PRISMA consigne chaque nœud visité et sa décision d'inclusion ou d'exclusion.
Compréhension multimodale des PDF.
En une passe, Docling extrait le texte, les figures, les tableaux et les zones ancrées à la page. Les zones de citation sont stockées avec leur décalage d'octets, pas seulement le numéro de page.
docling.parse s'exécute localement sur le PDF et produit un arbre de document structuré : segments de texte, zones de figures, zones de tableaux, tous ancrés à des coordonnées (page, paragraphe, caractère). Les citations renvoient à des zones précises ; les figures s'intègrent à votre synthèse avec leur légende d'origine.
Récupération hybride.
Première passe BM25 sur PubMed et sur votre corpus. Reclassement dense avec MedCPT-Article. Réécriture HyDE pour les requêtes courtes. L'inspecteur de récupération montre, résultat par résultat, ce qu'apporte chaque étape.
Trois étapes, toutes observables. BM25 resserre le vivier de candidats ; le reclassement dense applique un cross-encoder biomédical ; HyDE génère une réponse hypothétique pour élargir les requêtes courtes et ambiguës. La contribution de chaque étape est consignée dans le journal d'exécution, de quoi comprendre pourquoi un article est passé à côté.
Espace de travail, priorité au local.
Vos documents restent en Markdown sur le disque. Embeddings, reclassement et inférence LLM (optionnelle) s'exécutent sur votre matériel. Toute sortie réseau est explicite et se décide appel par appel.
Un dossier de projet ordinaire : manuscrits en Markdown, corpus en PDF, embeddings dans Qdrant sur disque, modèles de récupération en binaires gguf. Avant chaque appel, le plan de contrôle vous indique quels outils quitteront la machine. Versionnez votre travail dans git, comme du code.
Bibliographie auto-synthétisée.
Construit une bibliographie de travail, la dédoublonne et en analyse les lacunes au regard du graphe de citations déduit. Export Vancouver, APA, BibTeX, RIS.
L'agent Bibliographe de recherche tient à jour un ensemble structuré de références pour le document actif. Le dédoublonnage se fait par DOI, puis par PMID. Les rapports de lacunes signalent les sous-sujets sous-cités, par année, par groupe d'auteurs et par distance d'embedding au centroïde de votre ensemble.
- HFrEF pédiatrique : 0/30 articles
- SGLT2 en IRC avancée (DFGe < 30) : 1/30 articles
Validation croisée des résultats.
Retrouvez une affirmation à travers un corpus, puis classez chaque correspondance : directe, partielle, indirecte ou contradictoire. La grille de réplication fait ressortir les désaccords d'un coup d'œil.
Le Validateur croisé décompose votre affirmation en sous-affirmations vérifiables, les confronte une à une au corpus et rend un verdict par étude. La grille de réplication s'exporte en fiche de preuve d'une page. Les citations sont mot à mot, les verdicts auditables.
Profil de recherche et veille thématique.
Dressez le profil des travaux antérieurs d'un chercheur, construisez un voisinage thématique, puis abonnez-vous à PubMed pour les nouveautés au-dessus d'un seuil de pertinence.
La Veille bibliographique construit un profil thématique à partir des descripteurs MeSH et de la distance d'embedding, puis configure un abonnement PubMed quotidien à son aune. Au-dessus du seuil, les correspondances déclenchent un récapitulatif ; en dessous, elles sont consignées sans être affichées.
Comparez Intelectra : vs Elicit · vs Consensus · vs Scite