Jump to content
This Topic
Sign in to follow this  
Bascombe

Petite question pour les matheux.

Recommended Posts

Bonjour les matheux,

Les traductions dans le cadre des cours de langues sont généralement évaluées de la façon suivante : on attribue aux différentes erreurs une valeur négative en "points-fautes", et éventuellement à certaines propositions heureuses des points positifs (qui viennent en déduction des points-fautes). La somme de ces éléments produit un total de points-fautes, qu'il s'agit ensuite de convertir dans une échelle, qui traditionnellement va de 0 à 20. Si on se contente d'une fonction linéaire pour cette conversion, on obtient des notes assez mal réparties.

Ce que je cherche est une fonction mathématique qui me permettrait de convertir mes totaux de points fautes en une répartition normale, en fixant les paramètres comme le nombre de points faute équivalent à 10/20, les notes extrêmes et les points fautes correspondants (ou alors si c'est impossible, raisonner à partir de la moyenne et de l'écart-type). J'ai créé quelques formules dans Excel et en utilisant des racines carrées j'arrive à une répartition correcte mais je suis toujours en train de bidouiller la formule parce que les moyennes de points fautes changent selon la difficulté des textes et mes formules ne prennent pas ça en compte.

Exemple :

- Meilleure copie : 14 points fautes, à qui je voudrais attribuer la note de 16/20

- La moins bonne copie : 83 points fautes, à qui je voudrais attribuer la note de 4/20

- La copie que j'estime valoir 10/20 correspond à 32 points fautes

Il doit être possible d'utiliser une fonction d'excel pour ça non, mais laquelle ? (normale, poisson, student... j'ai tout oublié !).

J'ajoute que je sais que les jurys de concours résolvent le problème des notes négatives en fixant des plafonds de points-fautes par unité de traduction, mais je voudrais une solution qui me permette de me dispenser de ces plafonds (qui demandent un gros travail en amont de la correction proprement dite) tout en restant dans une échelle de notes de 0 à 20, c'est-à-dire que le poids des points fautes dans la note finale diminue vers une asymptote avec leur nombre, 0/20 correspondant à un nombre de points fautes infini.

Merci pour vos suggestions.

Edited by Bascombe

Share this post


Link to post
Share on other sites

Ok, il va falloir que je m'inscrive sur un forum de profs... :-/

Faut que tu donnes bien plus de paramètres si tu veux que quelqu'un te trouve un solution :

gallery_22759_470_6544.png

Tu veux une courbe comme la première ou la deuxième ? La deuxième donne une répartition qui s'apparentera plus à une cloche, avec plus d'élève proche de la moyenne et moins dans les extrême. La première une répartition en U avec plus d'élèves proches des extrêmes.

Ensuite il faut déterminer les points d'inflexions.

En tous cas, vu que la répartition n'est pas symétrique, puisque le nombre de fautes correspondant à la moyenne n'est pas la moyenne entre #faute min. et #faute max. ta courbe de répartition finale ne peux pas être une cloche de Gauss bien symétrique.

Share this post


Link to post
Share on other sites

Si on se contente d'une fonction linéaire pour cette conversion, on obtient des notes assez mal réparties.

Ce que je cherche est une fonction mathématique qui me permettrait de convertir mes totaux de points fautes en une répartition normale

Et pourquoi est-ce que les notes d'un petit échantillon d'élèves devraient être réparties de façon normale? En faisant ça tu truques les résultats. Si tous les élèves sont bons il n'y a pas de raison que certains voient leurs résultats artificiellement baissés (parce que ça revient à ça) et inversement s'ils sont tous mauvais et bien tant pis pour eux.

Cette volonté de vouloir avoir une répartition normale des notes est un défaut bien connu et étudié des enseignants mais d'habitude ils le font de manière inconsciente. C'est la première fois que j'en vois un qui veut le faire volontairement!

Ou alors il y a un objectif caché dans ta question qui m'échappe.

Edited by ylm

Share this post


Link to post
Share on other sites

Et pourquoi est-ce que les notes d'un petit échantillon d'élèves devraient être réparties de façon normales? En faisant ça tu truques les résultats. Si tous les élèves sont bons il n'y a pas de raison que certains voient leurs résultats artificiellement baissés (parce que ça revient à ça) et inversement s'ils sont tous mauvais et bien tant pis pour eux.

Cette volonté de vouloir avoir une répartition normale des notes est un défaut bien connu et étudié des enseignants mais d'habitude ils le font de manière inconsciente. c'est la première fois que j'en vois un qui veux le faire volontairement!

Ou alors il y a un objectif caché dans ta question qui m'échappe.

Je pense que la volonté est surtout d'être plus juste. Ici Bascombe assume sa part arbitrale en posant que 14 fautes = 16/20 et 84 fautes = 4/20. De même il ressent que celui qui a fait 32 fautes mérite la moyenne, alors qu'une répartition proportionnelle poserait la moyenne à 50 fautes. Son système n'entraine pas du tout le défaut que tu mets en avant, tu ne serait dans le vrai que si la note ne dépendait que du classement, alors qu'ici elle ne dépend que du nombre de faute.

Share this post


Link to post
Share on other sites

Je plussoie ylm et Byshop : Tu veux faire de ta médiane la moyenne, et c'est truquer les résultats, ou plutôt transformer un examen en concours. Les courbes présentées par Byshop transforment une échelle de notation linéaire (les points-fautes) en une échelle de notation déformée (ça se voit sur ses fonctions!), qui concentre arbitrairement les élèves dans certaines zones.

Imaginons un cas simple : tu as sept élèves, ta notation en points fautes revient à les classer de 1er à 7ème. Tu vas donc leur attribuer des notes en fonction de leur place dans le classement :

1er 14, 2ème 11,5, 3ème 10,5, 4ème 10, 5ème 9,5, 6ème 8,5 ,7ème 6. (courbe arbitrairement équilibrée avec un élève par classe de note, c'est juste pour l'exemple).

Ca n'a aucun sens pour évaluer a posteriori leur niveau en thème ou en version : comparer mon classement en 5ème avec 18 points-fautes (bon mais d'autres ont encore mieux traduit) et mon classement en 2ème avec 53 points-fautes (mauvais mais bien classé) mène à des incohérences évidentes.

Share this post


Link to post
Share on other sites

Je pense que la volonté est surtout d'être plus juste. Ici Bascombe assume sa part arbitrale en posant que 14 fautes = 16/20 et 84 fautes = 4/20. De même il ressent que celui qui a fait 32 fautes mérite la moyenne, alors qu'une répartition proportionnelle poserait la moyenne à 50 fautes. Son système n'entraine pas du tout le défaut que tu mets en avant, tu ne serait dans le vrai que si la note ne dépendait que du classement, alors qu'ici elle ne dépend que du nombre de faute.

Sauf que d'un examen de traduction à l'autre, l'échelle va changer, d'où incohérence pour évaluer les élèves sur la moyenne de leurs notes.

Les dictées ont longtemps (il y a longtemps ok) été corrigées sur une échelle qui n'était pas minorée par zéro : avoir 1 point, ou zéro, ou -5, ou -30 reflétait parfaitement le niveau de l'élève et l'amélioration nécessaire à apporter à son orthographe. On peut après compter zéro dans la moyenne au lieu de -30 (pour des raisons évidentes, car un -30 en début d'année ne sera jamais compensé par une dictée parfaite notée 20), mais au moins l'élève connaît son niveau et peut travailler pour l'améliorer (ce qui est bien plus important qu'avoir une note).

Share this post


Link to post
Share on other sites

On peut faire une résolution facile :

de 0 à 32 points-fautes, on peut arbitrer que la courbe de notation est une droite, la note vaut 20 pour 0 points-fautes et 10 pour 32 points fautes. Je note x1=0, x2=32, f(x1)=20, f(x2)=10, une équation affine de la droite se calcule via

f(x)-f(x1)=[[f(x2)-f(x1)]/[x2-x1]] * (x-x1)

D'où f(x)=(-10/32)*x + 20 sur l'intervalle [0;32].

{On peut aussi faire le calcul "qui donne au premier la meilleure note de 16", auquel cas j'appelle x0 le nombre de points-fautes de cette copie, et f(x0)=16. x0 et x2 sont les deux points connus de ma droite (pourvu que 0<=x0<x2), on a alors

f(x)-f(x2)=[[f(x2)-f(x0)]/[x2-x0]] * (x-x2)

que je ne résous pas par paresse et qui donne cette fois un coefficient linéaire de la fonction affine f qui dépend de x0.}

Choisir une courbe pour noter les fautes entre 32 et l'infini : Bascombe souhaite une fonction g telle que g(32)=10 (continuité en x2), (y=0) est asymptote à g lorsque x tend vers l'infini, ce qui nous laisse beaucoup de choix. On va ajouter la continuité de la dérivée en x2, c'est à dire f'(32)=g'(32).

Si on choisit g de la forme g(x)=a/(b+x), avec a et b des coefficients à déterminer, on a g(32)=10 qui nous donne une première équation a=10b-320; et g'(32)=f'(32) une deuxième équation. J'obtiens aux erreurs de calcul près a=320 et b=0, pour une fonction Excel qui va s'écrire :

if (x<32;(-10*x/32)+20;320/x) avec x la case (ou la variable) qui va bien.

Par un heureux hasard (car c'est bien de hasard qu'il s'agit), pour 80 points-faute, on obtient la note de 4.

Edited by taamer

Share this post


Link to post
Share on other sites

bon travail Taamer. Ça faisait longtemps que j'avais pas fait pas d'analyses fonctionnelles et à ça m'est revenu assez rapidement en lisant ton analyse. Ça a le mérite d'être clair. par contre pourquoi vouloir utiliser la régression linéaire, on peut peut-être utiliser une régression polynomiale d'ordre 2 sur tout l'intervalle

Edited by lazaridus

Share this post


Link to post
Share on other sites

Je plussoie ylm et Byshop : Tu veux faire de ta médiane la moyenne, et c'est truquer les résultats, ou plutôt transformer un examen en concours. Les courbes présentées par Byshop transforment une échelle de notation linéaire (les points-fautes) en une échelle de notation déformée (ça se voit sur ses fonctions!), qui concentre arbitrairement les élèves dans certaines zones.

Imaginons un cas simple : tu as sept élèves, ta notation en points fautes revient à les classer de 1er à 7ème. Tu vas donc leur attribuer des notes en fonction de leur place dans le classement :

1er 14, 2ème 11,5, 3ème 10,5, 4ème 10, 5ème 9,5, 6ème 8,5 ,7ème 6. (courbe arbitrairement équilibrée avec un élève par classe de note, c'est juste pour l'exemple).

Ca n'a aucun sens pour évaluer a posteriori leur niveau en thème ou en version : comparer mon classement en 5ème avec 18 points-fautes (bon mais d'autres ont encore mieux traduit) et mon classement en 2ème avec 53 points-fautes (mauvais mais bien classé) mène à des incohérences évidentes.

A aucun moment il ne dit vouloir faire de la médiane la moyenne. Il semble avoir choisi "32 => 10/20" non pas parce qu'il y a autant d'élèves qui ont fait plus de 32 fautes que d'élèves qui en ont fait moins de 32, mais parce que, communément, 10/20 c'est la note minimale acceptable. Donc s'il estime que la copie la moins pire restant acceptable comporte 32 fautes, même s'il n'y en a que quatre sur les trente élèves de son groupe de TD, alors il est parfaitement logique d'utiliser une méthode non linéaire. De la même façon, peut-être que 80% des élèves ont fait moins de 32 fautes. Il ne faut pas se perdre dans un procès sur son intention de rendre la distribution normale.

Cependant je comprends que taamer ait compris ça, mais c'est parce que la seconde courbe que je propose a justement ce défaut (la première étant totalement inadéquate amha). En effet la seconde courbe va faire que si on a une répartition linéaire des fautes (par exemple sur 71 élèves il y en aura un qui aura fait 14 fautes, un 15 fautes, un 16 fautes [...] un 84 fautes) alors au final la répartition des notes sera en cloche.

En fait ce qu'il faut c'est un rapport faute/note ayant cette allure :

gallery_22759_470_5668.png

Share this post


Link to post
Share on other sites

Il y a quand même deux points supplémentaires de la courbe qui sont connues .. f(0)=20 et lim (x->+infini) f(x) = 0 (que l'on peut en pratique remplacer par f(A)=0 avec A assez grand.

Mon intuition de la notation et de ses buts recherchés voudrait que la fonction f soit quasi linéaire de 0 à 32 et ne ralentisse de manière sensible que lorsque x devient grand.

Le problème tel qu'il est posé n'admet pas de solution unique, au mieux on cherchera une interpolation qui ait telle ou telle tronche suivant ce que tu cherches à obtenir. Les arguments statistiques pour choisir telle ou telle répartition risquent de plus d'aboutir à des résultats assez différents de la réalité pédagogique.

En première approximation (ça ne colle pas tout à fait à ce que tu cherches exactement mais ça colle assez bien à ma "perception pédagogique" personnelle), je te proposerais quelque chose du style

Note = 20 - 60*(tanh(fautes/60))*1/3

Ce qui donne : f(0) = 20 ; f(14)=15.42 ; f(32)=10.24 ; f(84)=2.29 (et à titre d'exemple f(65)=4.11 ; f(120)=0.72 ; f(45)=7.3 f(22)=12.98)

Share this post


Link to post
Share on other sites

Ah, ben voilà. Je me disais bien aussi que je pouvais espérer des contributions de qualités sur ce sujet.

Quelques précisions. En effet mon souci est d'être équitable, même si je me suis mal exprimé. Mon but en effet n'est pas de classer les étudiants (les points fautes y suffiraient), car il s'agit d'examens et non de concours.

L'évaluation d'une copie de traduction fait intervenir la subjectivité du correcteur, à plusieurs niveaux. C'est par exemple arbitraire (même si c'est un arbitraire informé par l'expérience), de dire que telle copie vaut la moyenne, ou que telle copie vaut 16/20. Je n'ai aucun problème à ce niveau. Ce que je veux, ce n'est pas une équité absolue par rapport à une norme fixée pour tel ou tel niveau (c'est vain dans un domaine comme les langues car il y a trop de paramètres et de facteurs humains), même si par l'expérience je m'efforce de m'en approcher, mais bien une justice relative entre les copies d'un même groupe.

J'employais en effet "normal" dans un sens mathématique, peut-être à tort, ne me rendant pas compte de l'idéologie pédagogique que cela véhiculait. La difficulté de mon problème tient à plusieurs facteurs. Tout d'abord comme je l'ai dit le fait que dans un petit nombre de copies il y a une telle accumulation de fautes que les prendre en référence dans une échelle linéaire remonterait mécaniquement toutes les autres copies à des niveaux que je juge trop généreux par rapport à la qualité des travaux produits. De là l'idée que les premiers points fautes se traduisent par une baisse plus rapide de la note. Car d'autre part une traduction n'est jamais entièrement nulle, et je ne me vois pas mettre la même note (0/20) à deux copies avec un nombre de points fautes élevé mais différent. Du coup la courbe de Pierre La Moon ne me convient pas.

L'autre souci est le fait que la difficulté des textes à traduire varie, d'un groupe à l'autre et d'une année à l'autre, et que bien souvent je ne me rends compte qu'a posteriori de cette difficulté.

La dernière courbe de Byshop me paraît répondre dans l'esprit à ma demande.

Pour rendre ma demande plus concrète voici le cas d'une série de points-fautes pour une version :

14, 17, 23, 25, 26, 27, 30, 33, 33, 34, 38, 38, 38, 38, 39, 40, 42, 47, 47, 50, 51, 64, 66, 68, 75, 75, 80, 121.

Pour un exercice où j'estime que la meilleure copie vaut 15/20, la moyenne 36 points fautes, les copies à 75 points fautes valent 4/20 et la copie à 121 mérite la note de 1/20.

Sachant bien sûr qu'idéalement je cherche une formule type que je puisse moduler en fonction de la difficulté des exercices.

Edited by Bascombe

Share this post


Link to post
Share on other sites

Voj, merci je postais pendant ta contribution. Les résultats de ta fonction me plaisent bien.

Share this post


Link to post
Share on other sites

Ok, si les résultats de cette fonction te plaisent bien, je vais l'étendre un peu pour que tu puisses t'en servir dans d'autres contextes.

Idée de base : on construit une fonction f : faute-> note.

Cette fonction est affine dans un premier domaine donc de la forme ax+b. Vu que 0 faute vaut toujours 20, b vaut toujours 20.

Pour les dictées de notre enfance cette fonction était juste affine. Mais nous on veut la transformer un peu. Pour la transformer on écrit donc que f(x)=b-ag(x) où g est une fonction transformante.

J'ai choisi une construction à base de tangente hyperbolique parce que c'est une fonction simple qui "colle" assez bien au problème.

L'idée de base est de définit un point que tu estimes valoir 10. Ici tu l'as mis à 32. De le décaler légèrement vers la gauche (ici j'ai choisi 30 mais 29 convenait très bien aussi). Lorsque tu as ce point moyen M (donc ici M=30) tu commences par déterminer b. Facile .. b = 10/M (d'où mon choix de 30).

Puis tu effectues tu détermines ta fonction g. Avec les données recherchées tu auras toujours g(x)=2M*tanh(x/2M)

Au final ta fonction s'écrira : f(x)= 20-(10/M)*2M*tanh(x/2M) = 20-20*tanh(x/2M).

A tester en pratique mais je subodore que ça marchera pas trop mal..

Share this post


Link to post
Share on other sites

Merci Voj tu as très bien cerné mes besoins. Je regarde ça de plus près demain et je vous dis.

Share this post


Link to post
Share on other sites

En multipliant par 1,1 la barre de points fautes dans la fonction de Voj, j'obtiens une formule qui me donne 10 quand je saisis la valeur en question, et pour le reste j'ai testé avec mon paquet témoin ça correspond tout à fait à ce que je cherchais.

La formule que je compte adopter est donc la suivante : f(x)= 20-20*tanh(x*0,55/M)

avec x = nombre de points fautes et M = nombre de points fautes valant 10/20.

Merci à tous, ça fait des années que je veux donner une forme rigoureuse à cette question et j'avais toujours laissé ça de côté. C'est bien pratique les maths en fait.

Maintenant le débat sur la pédagogie et l'évaluation peut commencer... (Nan, en fait, je préfère pas).

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

Sign in to follow this  

  • Recently Browsing   0 members

    No registered users viewing this page.

English
Retour en haut de page
×