none
Découpage des données pour apprentissage et les tests (c# .net)

Toutes les réponses

  • Bonjour à tous, 

    C'est la première fois que je travaille avec un Machine Learning et je rencontre pas mal de problèmes. I need help please.

    J'utilise un algorithme DecisionTree pour l'apprentissage, mes données sont stockées dans un fichier csv mais je ne trouve pas comment mettre en pratique le principe de découpage de données telque 2/3 pour l'apprentissage et 1/3 pour le test !!!

    Une deuxième chose c'est qu'une fois que je récupère le model (après l'apprentissage) pour élaborer les prédictions sans étiquettes, est-ce que je dois utiliser les mêmes codificateurs de données que j'ai utilisé dans la partie apprentissage ?

    Merciii d'avance.

    Cordialement,

    Dida

    jeudi 17 mai 2018 07:56
  • Bonjour Dida Bel,

    L'article Decision Trees in C# peut vous aider.

    Cordialement,
    Nina


    Microsoft propose ce service gratuitement, dans le but d'aider les utilisateurs et d'élargir les connaissances générales liées aux produits et technologies Microsoft. Ce contenu est fourni "tel quel" et il n'implique aucune responsabilité de la part de Microsoft.

    jeudi 17 mai 2018 11:32
    Modérateur
  • Bonjour Nina, 

    Merci pour votre réponse.

    Au fait c'est ce que j'ai fait sauf que moi je travaille sur un fichier csv au lieu d'une base de données du coup dans cet article  ils invoquent pas la parie sur laquelle je bloque .

    Cordialement,

    Dida 

    vendredi 18 mai 2018 09:17
  • Bonjour, 

    Au fait, j'ai réussie à découper mon programme en deux partie (apprentissage - test) et cela marche bien.

    En ce moment, j'utilise l'algorithme "RandomForestLearning" car il me donne des résultats plus précis que l'arbre de décision par contre j'ai un petit soucis avec le codificateur.

    En effet, mes données sont des string alors j'ai utilisé un codificateur pour les représenter par des valeurs numériques.

    je voulais savoir, est-ce que dans la partie test je dois utiliser le même codificateur que j'ai crée au moment d'apprentissage et si j'envois à mon programme test une donnée qui contient des  nouvelles valeurs qui n'ont pas été codifiées auparavant cela pourra marcher ou non! car si j'essaye de tester ça j'obtiens l'erreur suivante "la clé est absente dans le dictionnaire" car je veux qu'il me renvoi comme même une valeur au pif même si elle est fausse.

    Merci pour votre aide.

    Cordialement,

    Dida 

    mercredi 30 mai 2018 13:01