Documentation Trustdio

Importer depuis un PDF / URL

Upload PDF, scrap d'URL publique, indexation auto.

Vous avez déjà du contenu (FAQ web, CGV PDF, brochure produit) ? Pas besoin de tout retaper. Trustdio importe et structure automatiquement.

Import depuis une URL

Idéal pour récupérer une page FAQ existante, un article de blog, ou tout contenu public.

  1. 1

    Ouvrir l'importeur

    Knowledge Base → Importer → Depuis une URL.

  2. 2

    Coller l'URL publique

    L'URL doit être publique (accessible sans login). Pour du contenu derrière un paywall, utilisez plutôt l'import PDF.

  3. 3

    Vérifier la preview

    Trustdio scrape le HTML, retire le bruit (header, footer, pubs, navigation) et propose un découpage en articles. Vérifiez avant d'importer.

Import PDF

Glissez-déposez vos PDF dans Knowledge Base → Importer → PDF. Trustdio :

  • Extrait le texte (avec préservation de la structure : titres, listes)
  • Découpe automatiquement par sections (basé sur la hiérarchie de titres)
  • Crée un article par section ou un seul article (configurable)
  • Génère les embeddings vectoriels pour la recherche RAG

Limites & formats

  • Taille max : 20 Mo par fichier
  • Pages max : 200 par fichier
  • Formats acceptés : PDF (texte natif ou scanné), DOCX, ODT, MD, TXT
  • OCR automatique sur les PDF scannés (français, anglais — qualité variable selon le scan)
  • Traitement : 30 sec à 2 min selon la longueur

Que faire après l'import ?

  1. Vérifier le découpage — Trustdio devine les sections, mais c'est imparfait. Mergez ou splittez selon le besoin.
  2. Ajouter des tags — facilite le filtrage et améliore le routage RAG
  3. Reformuler les titres — passez en mode question (« Quels sont vos tarifs ? » au lieu de « Tarification »)
  4. Tester en preview — Assistant → Tester, posez des questions liées au contenu importé

Et après ?

Cette page vous a été utile ?

Modifié le · Suggérer une amélioration