L'idée de départ
CoursFinder est né d'un besoin très simple : retrouver rapidement une information dans mes fichiers de cours. L'objectif était d'uploader mes documents Word, d'extraire le texte, puis de chercher dedans avec Elasticsearch.
Le concept : uploader mes fichiers Word, extraire automatiquement le texte et le titre, puis indexer le tout pour une recherche rapide.
Comment ça fonctionne ?
Upload de documents
L'interface permet d'uploader des fichiers Word (.docx) contenant mes notes de cours.
Extraction de texte
Le contenu textuel est extrait automatiquement, ainsi que le titre du document.
Indexation Elasticsearch
Les données sont envoyées à Elasticsearch qui les indexe pour une recherche rapide.
Recherche instantanée
Une simple requête permet de retrouver tous les documents contenant un terme précis.
Le défi : configurer Elasticsearch
La partie la plus formatrice du projet a été la configuration d'Elasticsearch : paramètres de sécurité, ports, index, mapping et requêtes. Plusieurs essais ont été nécessaires avant d'obtenir une configuration stable.
Ce que j'ai appris
- Lire la doc officielle reste indispensable pour des outils qui évoluent vite.
- Configuration fine : comprendre elasticsearch.yml et les options de sécurité.
- Tester, échouer, recommencer : plusieurs installations ratées avant la bonne configuration.
Voir le projet
Le projet est disponible en ligne ou sur GitHub selon les liens ci-dessous.