Nuevas vías para la recuperación de información en corpus históricosclasificación del vocabulario

  1. María Agujetas Ortiz
  2. Pedro Sánchez-Prieto Borja
Revista:
Scriptum digital: revista de corpus diacrònics i edició digital en llengües iberoromàniques

ISSN: 2014-640X

Año de publicación: 2022

Número: 11

Páginas: 5-54

Tipo: Artículo

Otras publicaciones en: Scriptum digital: revista de corpus diacrònics i edició digital en llengües iberoromàniques

Resumen

El objetivo de este artículo es explorar la aplicación de modelos ontológicos en corpus diacronicos, ensayada en el subcorpus CN de CODEA; para ello, se ha procedido a la lematización interactiva y los lemas resultantes se han clasificado en una estructura jerárquica de tres niveles, próxima a las de las taxonomías. Los vínculos semánticos entre palabras vienen reforzados por su presencia, a veces, en más de un campo nocional. Se ha explorado también la navegación por raíces léxicas, estableciendo así asociaciones inmediatas entre palabras formalmente relacionadas. De esta manera, será posible la recuperación de información semántica, lo que constituirá un avance significativo respecto de las búsquedas meramente formales.

Referencias bibliográficas

  • AENOR (2013): UNE-ISO 25964-2: 2013. Información y documentación. Tesauros y su interoperabilidad con otros vocabularios. Madrid: Aenor.
  • AGUJETAS ORTIZ, María, Pedro SÁNCHEZ-PRIETO e Hiroto UEDA (2022): Inventario léxico de Castilla la Nueva: corpus CODEA. http://shimoda.lllf.uam.es/ueda/lyneal/il/cn/cn-prefacio.pdf [Consulta: 22/11/2022]
  • BARRIO DE LA ROSA, Florencio del (2016): «De haber a tener. La difusión de tener como verbo de posesión en la historia del español: Contextos y focos», en Carlota BENITO MORENO, Álvaro Octavio DE TOLEDO Y HUERTA (coords.), En torno a ‘haber’: Construcciones, usos y variación desde el latín hasta la actualidad, pp. 239-280.
  • BOISSIERE, Prudence (1852): Dictionnaire analogique de la langue française: répertoire complet des mots par les idées et les idées par les mots. [París: Editorial desconocida] .
  • BOSQUE, Ignacio (2016): «Sustantivo», en Javier GUTIÉRREZ-REXACH (coord.), Enciclopedia De Lingüística Hispánica. York : Routledge, vol. 1.
  • CASARES, Julio (1989 [1942]): Diccionario ideológico de la lengua española. Barcelona: Editorial Gustavo Gili.
  • CASTAÑEDA, Héctor-Neri (1962): «Lenguaje, pensamiento y realidad. Humanitas», Anuario del Centro de Estudios Humanísticos, n. 3, pp. 199-217.
  • CENTELLES, Miquel (2005): «Taxonomías para la categorización y la organización de la información en sitios web», Anuario Académico sobre Documentación Digital y Comunicación Interactiva, Univeritat Pompeu Fabra, n. 3. https://ddd.uab.cat/pub/artpub/2011/88755/hipertext_a2003n1a9/taxonomia s.html#:~:text=Una%20taxonom%C3%ADa%20es%20un%20tipo,contenidos%2 0de%20los%20sitios%20web [Consulta: 15/09/2022].
  • CODEA = GITHE (Grupo de Investigación Textos para la Historia del Español) (2022): CODEA+2022 (Corpus de documentos españoles anteriores a 1900). https://corpuscodea.es/ [Consulta: 29/11/2022]
  • CORDE = Real Academia Española (2001): Corpus Diacrónico del Español. http://corpus.rae.es/cordenet.html// [Consulta: 05/11/2022].
  • CRIADO DE DIEGO, Cecilia y María Antonieta ANDIÓN HERRERO (2018): «Lexicalización diminutiva en dos corpus originales (lengua oral y lengua escrita)», ELUA, 32, pp. 73-90.
  • COMUNIDAD DE MADRID, AYUNTAMIENTO DE SAN SEBASTIÁN DE LOS REYES Y GRUPO DE ARCHIVEROS DE MADRID (2011). XVIII Jornadas de archivos municipales de Madrid. Pilares de la eadministración: Cuadro de Clasificación y Tesauro. Madrid: BOCM.
  • DCECH = COROMINAS, Joan y Juan Antonio PASCUAL (1980-1991): Diccionario Crítico Etimológico Castellano e Hispánico. Madrid: Gredos.
  • DLE = REAL ACADEMIA ESPAÑOLA (2021): Diccionario de la lengua española. https://dle.rae.es/[Consulta: 29/11/2022].
  • DÍAZ PIRAQUIVE, Flor Nancy, Luis JOYANES AGUILAR y Víctor Hugo MEDINA GARCÍA (2009): «Taxonomía, ontología y folksonomía, ¿qué son y qué beneficios u oportunidades presentan para los usuarios de la web?», Univ. Empresa, Bogotá (Colombia), n. 8 (16), pp. 242-261.
  • GARCÍA GARCÍA, I. (2022): Instrucciones para leer la luna y espantar brujas. Magia y ritualidad en la Comunidad del Porto, Salinas [Tesis doctoral]. San Luis de Potosí S.L.P.: El Colegio de San Luis A. C.
  • GARCÍA MARCO, Francisco Javier y Miguel Ángel ESTEBAN NAVARRO (1993): «On some Contributions of the Cognitive Sciences and Epistemology to a Theory of Classification», Knowledge Organization, 20, n. 3, pp. 126-132.
  • GARCÍA MARCO, Francisco Javier (2017): «ISO 25964-2: interoperabilidad de los tesauros con otros sistemas de organización del conocimiento en contextos semánticos», Anuario ThinkEPI,v.11, pp. 305-309.
  • KAY, Christian, Marc ALEXANDER, Fraser DALLACHY, Jane ROBERTS, Michael SAMUELS y Irené WOTHERSPOON (eds.) (2022): The Historical Thesaurus of English. University of Glasgow. https://ht.ac.uk/ [Consulta: 17/11/2022].
  • LE CLERC, Jean (1716 [1692]): Logica, ontologia et pneumatologia. Londres: Impresor Johan Churchill.
  • LORENZO CADARSO, Pedro Luis; Agustín VIVAS MORENO; Justo CABEZAS COCHERO (1996): «Thesauro de oficios municipales del antiguo régimen castellano. Una propuesta de normalización para archivos históricos», Brocar, n. 20, pp. 177-209.
  • GARCÍA MARCO, Francisco Javier y Joaquín LÓPEZ DEL RAMO (2022): «Desarrollo de una taxonomía interoperable a partir del mapeo de taxonomías empíricas: un estudio de caso con los sitios web de las asociaciones de amigos del Camino de Santiago», Scire: representación y organización del conocimiento, n. 28(1), pp. 55-73.
  • MARTÍN PADILLA, Kenia (2015): «El análisis en familias de palabras como método de descripción léxica: el caso de abducir», en Cristóbal José ÁLVAREZ LÓPEZ, Blanca GARRIDO MARTÍN y Marina GONZÁLEZ SANZ (ed.) Jóvenes aportaciones a la investigación lingüística. Sevilla: Ediciones Alfar (pp. 289-304).
  • MARTÍNEZ BOTIJA, Sergio; Jesús PINTO FREYRE y Adrián SANTAMARIA PÉREZ (2016): Aristóteles en los orígenes del nacimiento de la ontología. Ene. vol. 10, n. 3. http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S1988- 348X2016000300003&lng=es&nrm=iso [Consulta: 14/09/2022].
  • MARTÍNEZ FERRERAS, Damián (2017): Los tesauros. Barcelona: UOC.
  • MARTÍNEZ TAMAYO, Ana María y Paola Verónica MENDES (2015): Diseño y desarrollo de tesauros. La Plata : Universidad Nacional de La Plata.
  • MINDÁN MANERO, Manuel (1969): Hitoria de la Filosofía y las Ciencias. Madrid: Anaya.
  • NTLLE = Real Academia Española: Nuevo tesoro lexicográfico de la lengua española http://ntlle.rae.es/ntlle/SrvltGUILoginNtlle [Consulta: 10/11/2022].
  • PAREDES GARCÍA, Florentino (2022): «Evaluación de las formas de diminutivo en español. Para la historia del cambio -illo>-ito», en Varia lección de la lengua española. Estudios sobre el corpus CODEA. Valencia: Tirant lo Blanch.
  • PENA, Jesús (2018): «La base de datos morfológica del español (BDME). Caracterización y estructura», en María Pilar Garcés Gómez (ed.), Perspectivas metodológicas en la elaboración de un diccionario histórico. Madrid/Frankfurt: Iberoamericana/Vervuert, pp. 17-62.
  • PERDOMO SÁNCHEZ, E., DÍAZ BLANCO, J., OJEDA GONZÁLEZ, A., AMADOR DOMÍNGUEZ, N. (2017): Análisis de los procesos de lematización y estemizado en lingüística computacional en Estudios Lingüísticos. https://www.researchgate.net/publication/322364515_ANALISIS_DE_LOS_PROCESOS_DE_LEMATIZACION_Y_ESTEMIZADO_EN_LINGUISTICA_COMPUTACIONAL [Consulta: 07/11/2022].
  • QUIRÓS GARCÍA, Mariano (2011): «Léxico e inventarios de bienes en el Bilbao del Siglo de Oro», Oihenart, n. 26, pp. 423-453.
  • RODRÍGUEZ-ESPIÑEIRA, María José y Yolanda LÓPEZ ARCA (2014): «El proyecto morfogen. Diseño de una aplicación web para visualizar familias léxicas», en Sagrario LÓPEZ POZA y Nieves PENA SUEIRO (eds.) Humanidades Digitales: desafíos, logros y perspectivas de futuro. A Coruña: Universidad da Coruña, SIELAE, Janus, Anexo 1, pp. 395-409.
  • ROGET, Peter Mark (1856): Thesaurus of English words and phrases. Londres: Logman, Brown, Green and Logmans.
  • UEDA, Hiroto (2019): «Lematización de los datos de codea y su utilización en análisis cuantitativos sobre la eñe y la hachemuda», Philologia Hispalensis, n. 33/1, pp. 161-178.
  • UEDA, Hiroto, Pedro SÁNCHEZ-PRIETO y Antonio MORENO (2020) «Lematización y visualización cartográfica del corpus CODEA. Formas de la conjunción y en el norte de Castilla medieval», Estudios de Lingüística del Español, n. 42, pp. 245-261.
  • UNESCO (2022 [1977]): UNESCO Thesaurus. http://vocabularies.unesco.org/thesaurus [Consulta: 29/11/2022]