La lingua delle prove INVALSI di matematica Le prove INVALSI di matematica sono essenzialmente dei «problemi verbali», cioè «testi (tipicamente contenenti informazioni quantitative) che descrivono una situazione che può essere supposta familiare al lettore e che pone una domanda quantitativa la cui soluzione può essere ottenuta grazie ad operazioni matematiche eseguite sui dati forniti dal testo o altrimenti dedotti» (Greer & al., 2002). I problemi verbali cercano di rendere i quesiti matematici più rilevanti per lo studente (anche se non sempre ci riescono, creando la categoria ontologica del «problema [insensato] di matematica», vedi Zan 2017) anche se l'aggiunta di un strato di linguaggio naturale può introdurre un ulteriore ostacolo alla comprensione nel caso in cui la lingua usata non fosse sufficientemente chiara allo studente. Questo fattore è particolarmente rilevante in una prospettiva d'inclusione, essendo gli studenti svantaggiati spesso non di madre lingua italiana (cresciuti o in un dialetto o in una lingua straniera). D'altro canto, è evidente la necessità che «le persone» e a maggior ragione gli studenti sappiano «essere in grado di svolgere un ragionamento matematico, di comprendere le prove matematiche e di comunicare in linguaggio matematico» (Consiglio dell'Unione Europea, 2018). Il linguaggio della matematiche, cioè, deve essere chiaro agli studenti. La chiarezza del linguaggio ha molte diverse componenti, ma una delle più rilevanti fra esse è il vocabolario: lo studente capisce davvero il significato di ogni parola del problema? Infatti Ferrari (2021) mette in guardia che «una parte delle difficoltà di apprendimento della matematica sia di natura linguistica». De Mauro (2019) distingue un «vocabolario fondamentale« italiano di 2000 lemmi, che possiamo supporre a disposizione di ogni persona in grado di parlare funzionalmente in italiano; un «vocabolario di alto uso» di 3000 lemmi che appaiono spesso nel linguaggio scritto o parlato; un «vocabolario di alta disponibilità» di 2500 lemmi che per quanto non compaiano frequentamente sono solitamente note ai madrelingua (l'esempio tipico è «peperone»). Seguendo De Mauro chiamiamo questi 7500 lemmi il «vocabolario di base» dell'Italiano, a cui vanno aggiunte 33.000 lemmi «comuni» (e circa 220.000 lemmi regionali, poetiche, specialistici o obsoleti). Il sistema d'istruzione italiano non prevede una lista di parole che lo studente deve possedere ad un certo livello scolastico, ma considerando quanto affermato da De Mauro nell'introduzione al suo vocabolario di base non è irragionevole considerare il vocabolario di base come noto alla fine del primo ciclo. Toth (2021) analizza la frequenza dei lemmi del vocabolario di base e comune nelle prove INVALSI di italiano di grado 5, 8, 10 e trova che la frequenza relativa non correla col livello di difficoltà: questo è parzialmente sorprendente, e Toth suggerische che ulteriori indagini sul vocabolario degli studenti dovrebbero essere portate avanti per comprendere il fenomeno. Rizzo (2022) mostra che lo stesso fenomeno sussiste per le prove di matematica di G8. Confermiamo, in questo lavoro, che lo stesso fenomeno accade in G2 e in G5: - In grado 2, il 98% dei lemmi appartiene al vocabolo di base nel primo ventile per difficoltà (risporte corrette fra il 6% e il 26%), il 96% nell'ultimo ventile per difficoltà (risposte corrette fra l'85% e il 93%), mentre sul totale delle prove il 94% appartiene al vocabolario di base. - In grado 5, il 95% dei lemmi appartiene al vocabolo di base nel primo ventile per difficoltà (risporte corrette fra il 7% e il 29%), il 97% nell'ultimo ventile per difficoltà (risposte corrette fra l'85% e il 96%), mentre sul totale delle prove il 94% appartiene al vocabolario di base. Come dati sorgente è stato usato l'intero corpus delle prove di Matematica di grado 2 e 5. Le parole, una volta tabulate e ordinate, sono state ricondotte al radicale utilizzando la libreria SnowBall (Porter 1980), distribuite automaticamente fra vocabolario fondamentale, di alto uso, di alta disponibilità, comune e specialistico, e infine — per le parole residue — distribuite a mano oppure eliminate in quanto nomi propri o «non parole» (ad esempio, ABCD in «il quadrato di lato ABCD»). L'analisi dei lemmi ha permesso inoltre di ricostruire un "vocabolario matematico di base" per la scuola primaria: tale vocabolario matematico è stato costruito a partire da Baruk (2018) integrando tutti i termini non presenti nel vocabolario fondamentale che abbiamo riconosciuti come "matematici" (ad esempio: "decina") In grado 2, ad esempio, i termini con frequenza maggiore del 2‰ sono (in ordine di occorrenza): numero, figura, due, più, tre, grafico, disegno, quadrato, rappresentare, triangolo, costruzione, primo. Mentre i termini non appartenenti al vocabolario fondamentale ma che appaiono nelle prove sono: rettangolo, decina, centinaio, uguaglianza, cilindrico, sottrazione, moltiplicare. In grado 5, invece, i termini con frequenza maggiore del 2‰ sono: numero, figura, più, due, misurare, rettangolo, rappresentare, grafico, disegno, tre, quadrato, uguale, triangolo, area, lato, probabilità, punto, dato, altezza. Mentre sono più di cinquanta i termini non appartenenti al vocabolario di base che compaione nelle prove. RIFERIMENTI Baruk, S. (2018). Dizionario di matematica elementare. Zanichelli. Consiglio dell'Unione Europea (2018). Raccomandazione del consiglio del 22 maggio 2018 relativa le competenze chiave per l'apprendimento permanente. De Mauro, T. (2019). Il nuovo vocabolario di base della lingua italiana. In: Guida all’uso delle parole (pp. 157–211). Laterza. Ferrari, P. L. (2021). Educazione matematica, lingua, linguaggi. Costruire, condividere e comunicare matematica in classe. UTET Università. Greer, B., Verschaffel, L., & de Corte, E. (2002). “The Answer is Really 4.5”: Beliefs About Word Problems. In: Beliefs: A Hidden Variable in Mathematics Education? (pp. 271–292). Springer Netherlands. Porter, M.F. (1980), "An algorithm for suffix stripping", Program: electronic library and information systems, Vol. 14 No. 3, pp. 130-137. Rizzo, O.G. (2022), "La lingua delle prove INVALSI di matematica di grado 8". VII Seminar INVALSI "INVALSI data: a tool for teaching and scientific research". Rome, November 2022. Toth, Z. (2021). Word formation in the INVALSI tests. VI Seminar "INVALSI data: a tool for teaching and scientific research". Rome, November 2021. Zan, R. (2017). Il ruolo cruciale del pensiero narrativo nella comprensione dei problemi. Didattica Della Matematica. Dalla Ricerca Alle Pratiche d’aula, (2), pp. 45-57 ================================================= The language of INVALSI Mathematics tests INVALSI Mathematics tests are mainly "world problems," i.e., "a text (typically containing quantitative information) that describes a situation assumed familiar to the reader and poses a quantitative question, an answer to which can be derived by mathematical operations performed on the data provided in the text, or otherwise inferred" (Greer & al., 2002). World problems strive to make a mathematical question more relevant to the student (and they do not always manage to do so, given the ontological category of "[senseless] mathematical problems," cf. Zan 2017) but the addition of a natural language layer could introduce a further obstacle to comprehension if the language is not clear enough to the student. This is particular relevant from an inclusiveness perspective, since disadvantaged students will often not have Italian as mother tongue (be it a local dialect or a foreign language). On the other hand, it is clear the need that "an individual»" — and henceforth a student — "should be able to reason mathematically, understand mathematical proof and communicate in mathematical language." The language of mathematics, that is, has to be clear to students. Clearness of language has many different components, amongst which a relevant one is vocabulary: do students actually understand the meaning of all the words in the problem? Indeed Ferrari (2021) warns that "parts of learning difficulties in Mathematics are of linguistic origin". De Mauro (2019) recognizes a "fundamental core" of 2000 Italian words, which any functional speaker of the language can be supposed to know; 3000 "high frequency" words, which occur often in the spoken or written language; 2500 "high availability" words, that albeit not appearing frequently are usually known to native speakers (e.g., "pepper"). Following De Mauro, we call these 7500 words the "basic" Italian vocabulary, to which we have to add 33,000 "common" words (and some 220,000 regional, poetical, specialistic or obsolete words). The Italian school system does not have an official set of words that have to be known at a given grade, but the introduction to De Mauro's fundamental core points out that it is not unreasonable to consider the basic 7500 word vocabulary as commonly known at grade 8. Toth (2021) analyses the word frequency of basic and common vocabulary in INVALSI Italian tests at grade 5, 8 and 10 and finds that word frequency does not explain the difficulty level: this is partially surprising, and Toth suggests that further inquiries are needed on students' vocabulary to understand the phenomenon. Rizzo (2022) shows that the same phenomenon holds for the G8 Mathematics tests. We confirm, in this work, that the same holds for G2 and G5. - In grade 2, 98% of words belongs to the basic vocabulary in the first ventile by difficulty (6%–26% of correct answers), 96% in the last ventile (85%-93% of correct ansers), while 94% of words of all items belong to the basic vocabulary. - In grade 5, 95% of words belongs to the basic vocabulary in the first ventile by difficulty (7%–29% of correct answers), 97% in the last ventile (85%-96% of correct ansers), while 94% of words of all items belong to the basic vocabulary. As source data we used the corpus of INVALSI Mathematics tests of grade 2 and 5. Collected and sorted words were stemmed using the SnowBall (Porter 1980) library; automatically sorted amongst fundamental, high frequency, high availability, common, and specialistic vocabulary. What remained was sorted by hands or cast away as non words (e.g., ABCD in "the square ABCD") The analysis of words let me reconstruct a "basic mathematical vocabulary" for primary school: this vocabulary was based on Baruk (1992) and supplemented with all words not belonging to the basic vocabulary which I determine to be "mathematical" (e.g., "decina", i.e. "tens"). REFERENCES Baruk (1992). Dictionnaire de mathématiques élémentaires. Seuil. Council of the European Union (2018). Council recommendation of 22 May 2018 on key competences for lifelong learning. De Mauro, T. (2019). Il nuovo vocabolario di base della lingua italiana. In: Guida all’uso delle parole (pp. 157–211). Laterza. Ferrari, P. L. (2021). Educazione matematica, lingua, linguaggi. Costruire, condividere e comunicare matematica in classe. UTET Università. Greer, B., Verschaffel, L., & de Corte, E. (2002). “The Answer is Really 4.5”: Beliefs About Word Problems. In: Beliefs: A Hidden Variable in Mathematics Education? (pp. 271–292). Springer Netherlands. Porter, M.F. (1980), "An algorithm for suffix stripping", Program: electronic library and information systems, Vol. 14 No. 3, pp. 130-137. Rizzo, O.G. (2022), "The language of INVALSI Mathematics tests of grade 8". VII Seminar INVALSI "INVALSI data: a tool for teaching and scientific research". Rome, November 2022. Toth, Z. (2021). Word formation in the INVALSI tests. VI Seminar "INVALSI data: a tool for teaching and scientific research". Rome, November 2021. Zan, R. (2017). Il ruolo cruciale del pensiero narrativo nella comprensione dei problemi. Didattica Della Matematica. Dalla Ricerca Alle Pratiche d’aula, (2), pp. 45-57