Wikcionario:Café/2024 11

Tech News: 2024-45

editar

MediaWiki message delivery 20:50 4 nov 2024 (UTC)

Tech News: 2024-46

editar

MediaWiki message delivery 00:07 12 nov 2024 (UTC)

Tech News: 2024-47

editar

MediaWiki message delivery 02:00 19 nov 2024 (UTC)

Propuesta de reducir (aun más) parámetros de pron-graf

editar

Creo haber solicitado permiso para borrar algún que otro parámetro de esta plantilla debido a que al haber implementado los módulos se volverían muy innecesarios. En realidad, ahora vengo a preguntar si estaría bien eliminar varios parámetros que nunca fueron usados a gran escala:

  • |s (|salt, |snota, etc.) : esta serie de parámetros era una fila adicional en la versión antigua de la plantilla, supuestamente para “palabras que también se representan con símbolos”, pero nunca se explicó en la documentación y en la práctica fue más común optar por “grafía alternativa”. -> unifico a |g (grafía alternativa).
  • |ts y derivados: esta serie de parámetros apuntaba a indicar una “transcripción silábica”, una transliteración de una grafía diferente pero agregando una separación en sílabas. Lo cierto es que como la transliteración debería poder pronunciarse desde el punto de vista del español, la separación en sílabas queda implícitamente aclarada, por lo que resulta redundante.
  • |e y derivados: esta serie de parámetros se utilizaba para indicar “escrituras alternativas”. Se diferenciaba de las “grafías alternativas” en cuanto que vincula palabras de sistemas de escritura distintos entre un mismo idioma, como ocurre con el japonés entre el hiragana y el katakana. En la práctica, lo más común fue utilizar “grafía alternativa” y agregar una nota adicional indicando la escritura correspondiente. Por lo que pronongo unificarlo a |g (grafía alternativa).
  • Todos los parámetros que terminen en “num”: recientemente en la guía de estilo agregué un criterio para ordenar las etimologías en el que básicamente se usa el criterio histórico. En general referenciar a otra entrada agregando el número de etimología me parece mala idea porque si se debe reordenar el orden en la página de esa palabra hay que cambiar los números en todas las que apunten a esa referencia. En mi opinión, no es necesario aclarar el número porque al cotejar las páginas de la página que referencia y la referenciada uno se da cuenta si por ejemplo una variante aplica a todas las etimologías o a una sola. En los pocos casos en los que haya ambigüedad, preferiría añadir una nota aclaratoria diciendo el sentido al que aplica. Esto aplica en general, tanto para palabras referenciadas con esta plantilla, como para palabras referenciadas en otra parte de la página.
  • Todos los parámetros que terminen con “tr”: agrega una transliteración a la variante o grafía alternativa, redundante en mi opinión ya que se puede acceder a la página correspondiente y leer la transliteración en su propia plantilla de pron-graf.

Las páginas con estos parámetros son menos de 300 [12]. Implementando estos cambios, la plantilal de pron-graf quedaría con, además de los parámetros “fonéticos”, parámetros para indicar variantes, grafías alternativas, homófonos y parónimos; cada uno con su “alt” (altera la apariencia) y “nota” (para agregar una nota a pie de página). No creo que se necesite más que eso. Tmagc (discusión) 15:21 20 nov 2024 (UTC)

Sign up for the language community meeting on November 29th, 16:00 UTC

editar

Hello everyone,

The next language community meeting is coming up next week, on November 29th, at 16:00 UTC (Zonestamp! For your timezone <https://zonestamp.toolforge.org/1732896000>). If you're interested in joining, you can sign up on this wiki page: <https://www.mediawiki.org/wiki/Wikimedia_Language_and_Product_Localization/Community_meetings#29_November_2024>.

This participant-driven meeting will be organized by the Wikimedia Foundation’s Language Product Localization team and the Language Diversity Hub. There will be presentations on topics like developing language keyboards, the creation of the Moore Wikipedia, and the language support track at Wiki Indaba. We will also have members from the Wayuunaiki community joining us to share their experiences with the Incubator and as a new community within our movement. This meeting will have a Spanish interpretation.

Looking forward to seeing you at the language community meeting! Cheers, Srishti 19:55 21 nov 2024 (UTC)

Propuesta para eliminar páginas con enclíticos

editar

Segunda propuesta: hay unas pocas páginas en el sitio de verbos con enclíticos. La idea es borrar casi todas, sino todas. Motivo? Es innecesario agregar más conjugaciones para cada forma canónica, ya hay bastantes sin considerar formas compuestas ni pronominales, etc. No veo cómo puede aportar valor al proyecto por lo que deberían ser borradas a menos que estén lexicalizadas con alguna definición diferente a la forma canónica, en cuyo caso se requeriría agregar la página pero introduciendo esta nueva definición. Tmagc (discusión) 15:29 20 nov 2024 (UTC)

¿Por qué para usted esas formas carecen de valor?  Ivanics (Res publica non dominetur) 00:04 21 nov 2024 (UTC)
quítalo = quita + lo. Lo considero un caso de suma de las partes. Si consideramos que las combinaciones es con lo/los/la/las/le/les es sumar seis formas flexivas más. Si agregamos quita+lo/los/la/las/le/les quitar+lo/los/la/las/le/les, quitándo+lo/los/la/las/le/les ya son 24 formas flexivas extra por cada verbo. Eso sería llenar la base de datos con más entradas que no aportan nada de información nueva, la regla para construir verbos enclíticos es prácticamente universal para todos los verbos. Tmagc (discusión) 00:14 21 nov 2024 (UTC)
Según ese argumento, también deberían borrarse las formas correspondientes a la conjugación de los verbos regulares, porque siguen una norma «prácticamente universal» para construirlos.  Ivanics (Res publica non dominetur) 00:20 21 nov 2024 (UTC)
Exacto! Solo que 1. hay varios verbos irregulares lo que de algún modo justificaría tener páginas aparte y 2. si fuera por mí borraría todas las entradas de formas flexivas porque no aportan nada de información nueva, solo dejaría la tabla de conjugación en la forma canónica y las formas no canónicas solo las que están lexicalizadas como pagaré, pero sería un cambio muy grande como para hacerlo en el corto plazo aunque no lo descarto. En cambio los enclítios son siempre regulares y por ahora solo hay 59 Categoría:ES:Formas con enclíticos. Estamos a tiempo de evitar que se propague el vicio. Tmagc (discusión) 00:49 21 nov 2024 (UTC)
    Muy en contra. El valor de Wikcionario por sobre un diccionario impreso común y corriente está en tener el potencial de ser un catálogo de todas las palabras existentes, incluyendo flexiones, conjugaciones, variantes, diminutivos, etcétera; lo que puede brindar un valor de uso importante para las personas que están aprendiendo un idioma, inteligencias artificiales, lingüistas e incluso hablantes comunes de un idioma.  Ivanics (Res publica non dominetur) 01:04 21 nov 2024 (UTC)
  A favor. Como decía en Discusión:quítalo, prefiero borrarlas ahora para hacer las cosas bien después, si es que así lo decidimos. @Tmagc: son muchas más de 24 por verbo si consideramos también las formas literarias/poéticas/potenciales como quitelo (= lo quité), quitaríamoslas (= las quitaríamos), etc. Si abrimos un melón, que sea con perspectiva: hemos necesitado 20 años para crear 59 entradas de una categoría que debería alojar millones, por lo que no aprecio su valor actual. @Ivanics: si un lingüista acude a nosotros, esto nos dejará en evidencia. Peter Bowman (discusión) 20:21 21 nov 2024 (UTC)
Mientras aceptemos tener formas no canónicas no veo motivo para sacar este pequeño subconjunto y conservar todo el resto. A menos que cause problemas diferentes al resto. ¿Es así? Saludos. Lin linao ¿dime? 15:22 22 nov 2024 (UTC)
Si el día de mañana acordamos poner en marcha un bot para que cree estas entradas en masa acorde a una plantilla, será más fácil partir desde cero que "rellenar huecos", por así decir, evitando pisar esas 59 formas que ya existen. Si en vez de 59 son 590, seguirán teniendo un valor insignificante, pero para nosotros supondrán más trabajo de cara a la revisión y posterior adaptación al formato que establezcamos. Yo en esa situación preferiría simplemente sobreescribirlas, entonces ¿para qué dejar que proliferen? La única forma de hacerlo bien es con un bot, y poner coto a su creación cuanto antes. Si el día de mañana llega alguien a Wikcionario y se propone crearlas manualmente, no querría tener que decirle que su trabajo es en vano, por el escaso o nulo impacto que va a tener, para que luego además venga un bot y se lo pise todo. Peter Bowman (discusión) 19:23 22 nov 2024 (UTC)
A mí esta propuesta me recuerda lo que pasó con el caso de los anagramas y pares mínimos: Tmagc procedió a su retiro con el argumento de que es un proceso automatizable y por tanto no tiene justificación invertir tiempo de trabajo humano en su realización. Sin embargo, nunca se ha puesto sobre la mesa un cronograma de automatización de ese proceso, sino que se ha pasado a otras tareas. En consecuencia, Wikcionario hoy tiene menos información de la que tenía hace un año, pero con la diferencia que ahora su incorporación queda completamente por fuera del campo de acción de los usuarios comunes y corrientes.  Ivanics (Res publica non dominetur) 23:52 22 nov 2024 (UTC)
Hablar de cronogramas no tendría sentido en un proyecto que es a voluntad, las cosas se hacen en la medida que se cuenta con el tiempo. En cuanto a los anagramas, ya está incorporado Wikcionario:Anagramas. En cuanto a los pares mínimos, todavía faltaría terminar de homogenizar pron-graf para parsear la base de datos pero lo tengo en mi lista de pendientes. En cuanto a los supuestos usuarios “comunes y corrientes”, justamente todas estas propuestas apuntan a incentivar a que agreguen léxico y a desincentivar tareas que son relativamente fáciles de automatizar. Bien que desde que inició el proyecto mucho chicherío pero ni siquiera está completo con las palabras de la base de datos del DLE, lo mínimo por donde se debería comenzar en cualquier diccionario. Pero de todas formas no hay nada que quede fuera del alcance de nadie, el código de las tareas de mi bot creo que se puede ver en Toolforge y si es mucho problema puedo publicar el repositorio para que se entretenga un rato si lo desea. No sé a lo que apuntaba el comentario pero menos información? Recuerdo que teníamos 920k entradas hace un año y ahora estamos cerca de 935k. Tmagc (discusión) 00:58 23 nov 2024 (UTC)
@Ivanics: sugiero que nos centremos en el tema que nos ocupa, porque en tu voto y comentarios parece que estás en otra discusión. Claramente, sí, la cuestión de los enclíticos queda fuera del campo de acción de los usuarios comunes y corrientes, y el proyecto no notará una pérdida de información por borrar esas 59 entradas. Peter Bowman (discusión) 11:27 23 nov 2024 (UTC)
Precisamente lo que quiero explicar es que el punto es que me parece que se está actuando bajo criterios subjetivos, al punto que no se ha dejado claro cuál es el argumento de borrado ¿Se eliminarían por ser irrelevantes o se eliminan por ser automatizables? Voté en contra porque el argumento que se presentó inicialmente es el primero.
Ahora, si es el segundo, pido amablemente el favor de que se adopte el criterio de no borrar información hasta que se haya implementado el sistema automático, en lugar de seguirlo haciendo al revés. Porque el mencionado carácter voluntario del proyecto hace que no hayan certezas de que haya alguien pendiente de que lo borrado sea restaurado luego, ya que por más que el código sea abierto, la programación es una habilidad menos extendida que la de editar código Mediawiki.  Ivanics (Res publica non dominetur) 12:39 23 nov 2024 (UTC)
En mí opinión los enclíticos son irrelevantes, además de ser automatizables. Si no lo son, habría que determinar el criterio para considerar a una página como la mera suma de las partes porque incluso aunque se escriban todo junto los enclíticos no veo cómo le agrega valor al proyecto tenerlos. Parece más una regla universal antes de ser algo que deba documentado acá.
Cierto, esto no es papel pero más allá de eso no le veo mucha diferencia con un diccionario cualquiera: una herramienta de consulta, no de aprendizaje. Se dan definiciones, no explicaciones. Mezclar las dos cosas podría confundir aún más a los lectores. Qué pasa con los millones de enclíticos que no están? Solo valen esos 59 que están ahora? El resto de construcciones enclíticas no son válidas?
Repito: si hay gente que usa un diccionario para aprender, recomiendo que se consigan un curso o lean los articulos de Wikipedia sobre el español. Acá como en cualquier diccionario el que lo usa lo hace para consultar, por lo tanto se asume que ya tiene un dominio claro del idioma. No es necesario confundir a la gente con sobreinformación. Y como ya dije alguna vez antes: si la gente prefiere Wikcionario, va a ser porque encuentren definiciones y léxico que no aparezcan en otros diccionarios, no por cuántos enclíticos aparezcan, ni siquiera porque tengamos páginas con enclíticos. Tmagc (discusión) 18:29 23 nov 2024 (UTC)
El último párrafo es una consideración subjetiva y yo difiero en el por qué la gente puede considerar útil a Wikcionario frente a otros diccionarios, como el de la RAE. Pero todo van a ser sólo opiniones hasta que alguien se anime a hacer un estudio sobre el tema.
Pero repito de nuevo: se están revolviendo dos argumentos antitéticos, el de la automatización y el de la irrelevancia. Hay que decidir cuál de los dos es el correcto, porque si son irrelevantes no tiene sentido automatizar la tarea.  Ivanics (Res publica non dominetur) 17:02 24 nov 2024 (UTC)
  • Páginas más visitadas ayer [13]
  • Páginas más visitadas el mes pasado [14]
  • Páginas más visitadas el año pasado [15]
  • Páginas mías más visitadas [16]: son gede y pechofrío. Que yo sepa ninguna está en ningún diccionario.
  • Páginas de Ivanics más visitadas [17]
Esporádicamente se cuelan algunas formas flexivas en femenino o en plural. Pero no vi ningún enclítico. Tmagc (discusión) 20:43 24 nov 2024 (UTC)
¿Que las formas no canónicas no sean las más visitadas significa que son irrelevantes?  Ivanics (Res publica non dominetur) 01:54 26 nov 2024 (UTC)
  En contra. Hola a todos. Que se programe la automatización primero, o incluso redirecciones automatizadas; luego se eliminen. Pero tener cuidado de no eliminar la página entera cuando tenga acepciones no-flexivas, o secciones en otros idiomas. A quien sea que programe la automatización le doy mis gracias de antemano.— Genoskill (discusión) 23:48 26 nov 2024 (UTC)

Tech News: 2024-48

editar

MediaWiki message delivery 22:42 25 nov 2024 (UTC)