El Café de Wikcionario
Esta página es para todo tipo de conversaciones y preguntas respecto a Wikcionario en español.

Antes de participar, ten en cuenta:

  • Para presentar preguntas sobre alguna entrada en particular, ve a Consultas. Para solicitar la creación de una entrada, visita Solicitudes. Si buscas donde colaborar, aquí tienes un listado de términos que necesitan ser mejorados.
  • Las conversaciones inactivas (más de un mes sin ediciones) están en el Archivo del café.
  • Por favor, después de editar, pon un comentario en el resumen (la síntesis del tema sobre el que aportas o comentas) para que se pueda ver en la página de cambios recientes. ¡Gracias!

Para abrir un nuevo tema de conversación, pulsa aquí

Atajo:
WN:C


noviembre de 2024

Tech News: 2024-45

MediaWiki message delivery 20:50 4 nov 2024 (UTC)Responder

Tech News: 2024-46

MediaWiki message delivery 00:07 12 nov 2024 (UTC)Responder

Tech News: 2024-47

MediaWiki message delivery 02:00 19 nov 2024 (UTC)Responder

Propuesta de reducir (aun más) parámetros de pron-graf

Creo haber solicitado permiso para borrar algún que otro parámetro de esta plantilla debido a que al haber implementado los módulos se volverían muy innecesarios. En realidad, ahora vengo a preguntar si estaría bien eliminar varios parámetros que nunca fueron usados a gran escala:

  • |s (|salt, |snota, etc.) : esta serie de parámetros era una fila adicional en la versión antigua de la plantilla, supuestamente para “palabras que también se representan con símbolos”, pero nunca se explicó en la documentación y en la práctica fue más común optar por “grafía alternativa”. -> unifico a |g (grafía alternativa).
  • |ts y derivados: esta serie de parámetros apuntaba a indicar una “transcripción silábica”, una transliteración de una grafía diferente pero agregando una separación en sílabas. Lo cierto es que como la transliteración debería poder pronunciarse desde el punto de vista del español, la separación en sílabas queda implícitamente aclarada, por lo que resulta redundante.
  • |e y derivados: esta serie de parámetros se utilizaba para indicar “escrituras alternativas”. Se diferenciaba de las “grafías alternativas” en cuanto que vincula palabras de sistemas de escritura distintos entre un mismo idioma, como ocurre con el japonés entre el hiragana y el katakana. En la práctica, lo más común fue utilizar “grafía alternativa” y agregar una nota adicional indicando la escritura correspondiente. Por lo que pronongo unificarlo a |g (grafía alternativa).
  • Todos los parámetros que terminen en “num”: recientemente en la guía de estilo agregué un criterio para ordenar las etimologías en el que básicamente se usa el criterio histórico. En general referenciar a otra entrada agregando el número de etimología me parece mala idea porque si se debe reordenar el orden en la página de esa palabra hay que cambiar los números en todas las que apunten a esa referencia. En mi opinión, no es necesario aclarar el número porque al cotejar las páginas de la página que referencia y la referenciada uno se da cuenta si por ejemplo una variante aplica a todas las etimologías o a una sola. En los pocos casos en los que haya ambigüedad, preferiría añadir una nota aclaratoria diciendo el sentido al que aplica. Esto aplica en general, tanto para palabras referenciadas con esta plantilla, como para palabras referenciadas en otra parte de la página.
  • Todos los parámetros que terminen con “tr”: agrega una transliteración a la variante o grafía alternativa, redundante en mi opinión ya que se puede acceder a la página correspondiente y leer la transliteración en su propia plantilla de pron-graf.

Las páginas con estos parámetros son menos de 300 [12]. Implementando estos cambios, la plantilal de pron-graf quedaría con, además de los parámetros “fonéticos”, parámetros para indicar variantes, grafías alternativas, homófonos y parónimos; cada uno con su “alt” (altera la apariencia) y “nota” (para agregar una nota a pie de página). No creo que se necesite más que eso. Tmagc (discusión) 15:21 20 nov 2024 (UTC)Responder

Sign up for the language community meeting on November 29th, 16:00 UTC

Hello everyone,

The next language community meeting is coming up next week, on November 29th, at 16:00 UTC (Zonestamp! For your timezone <https://zonestamp.toolforge.org/1732896000>). If you're interested in joining, you can sign up on this wiki page: <https://www.mediawiki.org/wiki/Wikimedia_Language_and_Product_Localization/Community_meetings#29_November_2024>.

This participant-driven meeting will be organized by the Wikimedia Foundation’s Language Product Localization team and the Language Diversity Hub. There will be presentations on topics like developing language keyboards, the creation of the Moore Wikipedia, and the language support track at Wiki Indaba. We will also have members from the Wayuunaiki community joining us to share their experiences with the Incubator and as a new community within our movement. This meeting will have a Spanish interpretation.

Looking forward to seeing you at the language community meeting! Cheers, Srishti 19:55 21 nov 2024 (UTC)Responder

Propuesta para eliminar páginas con enclíticos

Segunda propuesta: hay unas pocas páginas en el sitio de verbos con enclíticos. La idea es borrar casi todas, sino todas. Motivo? Es innecesario agregar más conjugaciones para cada forma canónica, ya hay bastantes sin considerar formas compuestas ni pronominales, etc. No veo cómo puede aportar valor al proyecto por lo que deberían ser borradas a menos que estén lexicalizadas con alguna definición diferente a la forma canónica, en cuyo caso se requeriría agregar la página pero introduciendo esta nueva definición. Tmagc (discusión) 15:29 20 nov 2024 (UTC)Responder

¿Por qué para usted esas formas carecen de valor?  Ivanics (Res publica non dominetur) 00:04 21 nov 2024 (UTC)Responder
quítalo = quita + lo. Lo considero un caso de suma de las partes. Si consideramos que las combinaciones es con lo/los/la/las/le/les es sumar seis formas flexivas más. Si agregamos quita+lo/los/la/las/le/les quitar+lo/los/la/las/le/les, quitándo+lo/los/la/las/le/les ya son 24 formas flexivas extra por cada verbo. Eso sería llenar la base de datos con más entradas que no aportan nada de información nueva, la regla para construir verbos enclíticos es prácticamente universal para todos los verbos. Tmagc (discusión) 00:14 21 nov 2024 (UTC)Responder
Según ese argumento, también deberían borrarse las formas correspondientes a la conjugación de los verbos regulares, porque siguen una norma «prácticamente universal» para construirlos.  Ivanics (Res publica non dominetur) 00:20 21 nov 2024 (UTC)Responder
Exacto! Solo que 1. hay varios verbos irregulares lo que de algún modo justificaría tener páginas aparte y 2. si fuera por mí borraría todas las entradas de formas flexivas porque no aportan nada de información nueva, solo dejaría la tabla de conjugación en la forma canónica y las formas no canónicas solo las que están lexicalizadas como pagaré, pero sería un cambio muy grande como para hacerlo en el corto plazo aunque no lo descarto. En cambio los enclítios son siempre regulares y por ahora solo hay 59 Categoría:ES:Formas con enclíticos. Estamos a tiempo de evitar que se propague el vicio. Tmagc (discusión) 00:49 21 nov 2024 (UTC)Responder
    Muy en contra. El valor de Wikcionario por sobre un diccionario impreso común y corriente está en tener el potencial de ser un catálogo de todas las palabras existentes, incluyendo flexiones, conjugaciones, variantes, diminutivos, etcétera; lo que puede brindar un valor de uso importante para las personas que están aprendiendo un idioma, inteligencias artificiales, lingüistas e incluso hablantes comunes de un idioma.  Ivanics (Res publica non dominetur) 01:04 21 nov 2024 (UTC)Responder
  A favor. Como decía en Discusión:quítalo, prefiero borrarlas ahora para hacer las cosas bien después, si es que así lo decidimos. @Tmagc: son muchas más de 24 por verbo si consideramos también las formas literarias/poéticas/potenciales como quitelo (= lo quité), quitaríamoslas (= las quitaríamos), etc. Si abrimos un melón, que sea con perspectiva: hemos necesitado 20 años para crear 59 entradas de una categoría que debería alojar millones, por lo que no aprecio su valor actual. @Ivanics: si un lingüista acude a nosotros, esto nos dejará en evidencia. Peter Bowman (discusión) 20:21 21 nov 2024 (UTC)Responder
Mientras aceptemos tener formas no canónicas no veo motivo para sacar este pequeño subconjunto y conservar todo el resto. A menos que cause problemas diferentes al resto. ¿Es así? Saludos. Lin linao ¿dime? 15:22 22 nov 2024 (UTC)Responder
Si el día de mañana acordamos poner en marcha un bot para que cree estas entradas en masa acorde a una plantilla, será más fácil partir desde cero que "rellenar huecos", por así decir, evitando pisar esas 59 formas que ya existen. Si en vez de 59 son 590, seguirán teniendo un valor insignificante, pero para nosotros supondrán más trabajo de cara a la revisión y posterior adaptación al formato que establezcamos. Yo en esa situación preferiría simplemente sobreescribirlas, entonces ¿para qué dejar que proliferen? La única forma de hacerlo bien es con un bot, y poner coto a su creación cuanto antes. Si el día de mañana llega alguien a Wikcionario y se propone crearlas manualmente, no querría tener que decirle que su trabajo es en vano, por el escaso o nulo impacto que va a tener, para que luego además venga un bot y se lo pise todo. Peter Bowman (discusión) 19:23 22 nov 2024 (UTC)Responder
A mí esta propuesta me recuerda lo que pasó con el caso de los anagramas y pares mínimos: Tmagc procedió a su retiro con el argumento de que es un proceso automatizable y por tanto no tiene justificación invertir tiempo de trabajo humano en su realización. Sin embargo, nunca se ha puesto sobre la mesa un cronograma de automatización de ese proceso, sino que se ha pasado a otras tareas. En consecuencia, Wikcionario hoy tiene menos información de la que tenía hace un año, pero con la diferencia que ahora su incorporación queda completamente por fuera del campo de acción de los usuarios comunes y corrientes.  Ivanics (Res publica non dominetur) 23:52 22 nov 2024 (UTC)Responder
Hablar de cronogramas no tendría sentido en un proyecto que es a voluntad, las cosas se hacen en la medida que se cuenta con el tiempo. En cuanto a los anagramas, ya está incorporado Wikcionario:Anagramas. En cuanto a los pares mínimos, todavía faltaría terminar de homogenizar pron-graf para parsear la base de datos pero lo tengo en mi lista de pendientes. En cuanto a los supuestos usuarios “comunes y corrientes”, justamente todas estas propuestas apuntan a incentivar a que agreguen léxico y a desincentivar tareas que son relativamente fáciles de automatizar. Bien que desde que inició el proyecto mucho chicherío pero ni siquiera está completo con las palabras de la base de datos del DLE, lo mínimo por donde se debería comenzar en cualquier diccionario. Pero de todas formas no hay nada que quede fuera del alcance de nadie, el código de las tareas de mi bot creo que se puede ver en Toolforge y si es mucho problema puedo publicar el repositorio para que se entretenga un rato si lo desea. No sé a lo que apuntaba el comentario pero menos información? Recuerdo que teníamos 920k entradas hace un año y ahora estamos cerca de 935k. Tmagc (discusión) 00:58 23 nov 2024 (UTC)Responder
@Ivanics: sugiero que nos centremos en el tema que nos ocupa, porque en tu voto y comentarios parece que estás en otra discusión. Claramente, sí, la cuestión de los enclíticos queda fuera del campo de acción de los usuarios comunes y corrientes, y el proyecto no notará una pérdida de información por borrar esas 59 entradas. Peter Bowman (discusión) 11:27 23 nov 2024 (UTC)Responder
Precisamente lo que quiero explicar es que el punto es que me parece que se está actuando bajo criterios subjetivos, al punto que no se ha dejado claro cuál es el argumento de borrado ¿Se eliminarían por ser irrelevantes o se eliminan por ser automatizables? Voté en contra porque el argumento que se presentó inicialmente es el primero.
Ahora, si es el segundo, pido amablemente el favor de que se adopte el criterio de no borrar información hasta que se haya implementado el sistema automático, en lugar de seguirlo haciendo al revés. Porque el mencionado carácter voluntario del proyecto hace que no hayan certezas de que haya alguien pendiente de que lo borrado sea restaurado luego, ya que por más que el código sea abierto, la programación es una habilidad menos extendida que la de editar código Mediawiki.  Ivanics (Res publica non dominetur) 12:39 23 nov 2024 (UTC)Responder
En mí opinión los enclíticos son irrelevantes, además de ser automatizables. Si no lo son, habría que determinar el criterio para considerar a una página como la mera suma de las partes porque incluso aunque se escriban todo junto los enclíticos no veo cómo le agrega valor al proyecto tenerlos. Parece más una regla universal antes de ser algo que deba documentado acá.
Cierto, esto no es papel pero más allá de eso no le veo mucha diferencia con un diccionario cualquiera: una herramienta de consulta, no de aprendizaje. Se dan definiciones, no explicaciones. Mezclar las dos cosas podría confundir aún más a los lectores. Qué pasa con los millones de enclíticos que no están? Solo valen esos 59 que están ahora? El resto de construcciones enclíticas no son válidas?
Repito: si hay gente que usa un diccionario para aprender, recomiendo que se consigan un curso o lean los articulos de Wikipedia sobre el español. Acá como en cualquier diccionario el que lo usa lo hace para consultar, por lo tanto se asume que ya tiene un dominio claro del idioma. No es necesario confundir a la gente con sobreinformación. Y como ya dije alguna vez antes: si la gente prefiere Wikcionario, va a ser porque encuentren definiciones y léxico que no aparezcan en otros diccionarios, no por cuántos enclíticos aparezcan, ni siquiera porque tengamos páginas con enclíticos. Tmagc (discusión) 18:29 23 nov 2024 (UTC)Responder
El último párrafo es una consideración subjetiva y yo difiero en el por qué la gente puede considerar útil a Wikcionario frente a otros diccionarios, como el de la RAE. Pero todo van a ser sólo opiniones hasta que alguien se anime a hacer un estudio sobre el tema.
Pero repito de nuevo: se están revolviendo dos argumentos antitéticos, el de la automatización y el de la irrelevancia. Hay que decidir cuál de los dos es el correcto, porque si son irrelevantes no tiene sentido automatizar la tarea.  Ivanics (Res publica non dominetur) 17:02 24 nov 2024 (UTC)Responder
  • Páginas más visitadas ayer [13]
  • Páginas más visitadas el mes pasado [14]
  • Páginas más visitadas el año pasado [15]
  • Páginas mías más visitadas [16]: son gede y pechofrío. Que yo sepa ninguna está en ningún diccionario.
  • Páginas de Ivanics más visitadas [17]
Esporádicamente se cuelan algunas formas flexivas en femenino o en plural. Pero no vi ningún enclítico. Tmagc (discusión) 20:43 24 nov 2024 (UTC)Responder
¿Que las formas no canónicas no sean las más visitadas significa que son irrelevantes?  Ivanics (Res publica non dominetur) 01:54 26 nov 2024 (UTC)Responder
  En contra. Hola a todos. Que se programe la automatización primero, o incluso redirecciones automatizadas; luego se eliminen. Pero tener cuidado de no eliminar la página entera cuando tenga acepciones no-flexivas, o secciones en otros idiomas. A quien sea que programe la automatización le doy mis gracias de antemano.— Genoskill (discusión) 23:48 26 nov 2024 (UTC)Responder

Tech News: 2024-48

MediaWiki message delivery 22:42 25 nov 2024 (UTC)Responder

Actual

Información de caracter, incluso en artículos sin crear

He visto que en el Wikcionario en inglés hay un bloque que muestra información de caracteres Unicode incluso aunque el artículo no se haya creado. Véase {{Template:character_info}}. Por ejemplo:

Esto podría ser útil porque significaría que se pueda enlazar artículos al Wikcionario en español como referencia aunque aún no se hubiera creado el artículo. Hay muchos artículos de Wikipedia que enlazan a ideogramas del Wikcionario como Babilonia o Astarte. Saludos. Serg!o (discusión) 11:06 30 oct 2023 (UTC)Responder

@Serg!o Pensé exactamente lo mismo. El laburo ya está hecho. Y esto lo digo para el resto también. Revisen la plantilla {{mostrar-unicode}}. La misma genera la información Unicode en forma automática del caracter del título de la página, siempre que sea de un único caracter. También es posible especificar otro caracter arbitrario, por codepoint o en forma directa. La documentación de uso está en la página de la plantilla. Asimismo, en Apéndice:Caracteres Unicode están todas las tablas generadas. Todo esto se lo debemos a quienes hicieron la versión en inglés.
Por lo tanto, exhorto para que la antigua plantilla {{unicode}} sea dada de baja; o bien, trasladar la versión que adapté a {{unicode}}. Pienso que lo primero podría ser más sencillo porque esta última plantilla recibe parámetros incompatibles (e innecesarios) para la nueva. Además las páginas que usan esa plantilla son menos de mil así que la migración sería fácil de hacer.
Por último, a mí me gusta más el estilo visual del sitio en inglés. Pero si quieren mantener el estilo de la plantilla vieja, lo cambiamos no hay problema. Tmagc (discusión) 23:12 26 nov 2023 (UTC)Responder
¡Maravilloso! Gracias por el trabajazo de importarlo, adaptarlo y traducirlo, @Tmagc. El trabajo de sustituir la plantilla Error de Lua en Módulo:error en la línea 19: PLANTILLA OBSOLETA.
debería ser sencillo, ¿lo podría hacer un bot? Por otra parte, para que aparezca en los artículos, no estoy seguro de que es lo que habría que modificar. --Serg!o (discusión) 09:55 27 nov 2023 (UTC)Responder
@Serg!o: No entendí. No hay ninguna plantilla que se llame Tagalo. Mostrame un ejemplo de lo que te gustaría hacer, sino no puedo ayudar. Tmagc (discusión) 12:40 28 nov 2023 (UTC)Responder
Hola. En Especial:Diff/5181030 he movido {{mostrar-unicode}} para que aparezca dentro de la sección translingüística, no por fuera, como he observado en los actuales usos de {{unicode}}. Un saludo, Peter Bowman (discusión) 10:04 29 dic 2023 (UTC)Responder
@Peter Bowman ¿Por qué? Según mi opinión, la idea es que la plantilla no esté anidada a los subtítulos de idiomas, sino justamente que aparezca antes; ya que si hay varios idiomas debería invocarse una única vez y no una vez por cada idioma. Tmagc (discusión) 15:19 29 dic 2023 (UTC)Responder
@Tmagc, en principio diría que por coherencia y compartimentalización: el contenido de las entradas va dentro de cada sección y fuera es tierra de nadie, solo viven allí las desambiguaciones y algunas plantillas de avisos. Pasa algo similar con las ilustraciones, que aunque deban ir repetidas, las colocamos dentro de sus secciones de idioma correspondientes. Sin embargo, en @ lo dejaría como está, con una única invocación dentro de "translingüístico" (como hiciste en Especial:Diff/5173296). Peter Bowman (discusión) 17:14 29 dic 2023 (UTC)Responder
@Peter Bowman Yo propongo ponerla al comienzo de todo, después de la plantilla de desambiguación. Me parece más consistente porque:
  1. La plantilla refiere al caracter, es decir, al título y no a un idioma específico. Entonces jerárquicamente es más consistente colocarla fuera de los títulos de idiomas
  2. Se aprovecha mejor el espacio, porque de todas formas queda un espacio en blanco a la derecha debido a la tabla de contenidos que se genera y de otra forma queda menos espacio para poner fotos y otras tablas
  3. Si se pone la plantilla junto a la de pron-graf, aparecen una al lado de la otra en lugar de aparecer una debajo de la otra, como en ב
Tmagc (discusión) 05:20 18 ene 2024 (UTC)Responder
De acuerdo, tiene sentido. Revisaría aun así el formato para que la plantilla se adapte bien a la versión para móviles (convendría centrar sus elementos). Peter Bowman (discusión) 11:24 18 ene 2024 (UTC)Responder

Agregar pronunciación de forma automática en la plantilla pron-graf

Buen día. Desde hace un tiempo estuve pensando en automatizar la pronunciación de las palabras. La idea consiste en que, debido a que la gran mayoría de las palabras son regulares, no debería ser TAN difícil un algoritmo que separe en sílabas y obtenga los fonemas equivalentes de la pronunciación.

Por mi parte no pienso que aclarar la pronunciación sea algo que valga la pena, a menos que la misma sea irregular (v.g. peceto). Lo cierto es que me da fiaca programar un algoritmo de cero. Y resulta que encontré en el Wikcionario en inglés un módulo que hace exactamente esto (es-pronunc).

Entonces, voy a pedirlo prestado e implementarlo acá. NO voy a tocar nada en las palabras que ya tengan la pronunciación especificada, sólo va a estar en las palabras que tengan la plantilla vacía. Cuando termine y esté andando bien, dejo otro aviso más. Tmagc (discusión) 14:56 3 dic 2023 (UTC)Responder

Estaría muy muy bien. Antes el módulo del inglés tenia unos inventos grandes sobre el yeísmo y la distinción, pero veo que ya los arreglaron. Sigue con lo de que s antes de consonante es [z], pero qué se la va a hacer, muchas o todas las referencias lo dicen. Estoy totalmente a favor si se deja la posibilidad de poner a mano pronunciaciones irregulares, como las de chuico, ushuaiense, ingey, xoconostle o oaxaqueño. Gracias por esto, sería un progreso enorme. Saludos. Lin linao ¿dime? 16:39 3 dic 2023 (UTC)Responder
HABEMUS MÓDULO!! Acabo de hacer las primeras pruebas llamando al módulo directo, sin la plantilla y funciona bastante bien. Ahora necesito invocarlo desde la plantilla {{pron-graf}} para terminar de debuggear todos los problemas cuando se llama con parámetros normal, por lo que van a ver alguans cosas raras por un tiempo. Si para hoy no logro arreglarlo prometo revertir los cambios que hice en la plantillas. Tmagc (discusión) 00:37 19 dic 2023 (UTC)Responder
Bueno, creo que por el momento está aceptable. Les pido/informo un par de cosas:
  1. Debido a los cambios que estuve haciendo, y que probablemente siga retocando detalles, les pido que comprueben las páginas vaciando la caché con action=purge antes de comentar. Es posible que durante algunos días algunas queden con alguna versión no actualizada de la plantilla.
  2. Que revisen exhaustivamente y digan si hay algo que está mal o les gustaría cambiar algo de la plantilla. Si ven, hay un par de detalles que simplifiqué porque me simplificaban la programación.
  3. La plantilla tiene soporte para palabras irregulares, para esto deben pasar el parámetro |ayuda y reescribir la palabra tal que se pronuncie como si fuera regular. Vean los ejemplos de ushuaiense, oaxaqueño, peceto y Bluetooth (esta última la tienen en minúscula y dicen que los españoles la pronuncian “blutuz” en vez de "blutud", ¿es cierto?). @Lin linao necesitaría que me digas o que pruebes cómo serían las de ingey, chuico y xoconostle para contribuir al desarrollo del módulo, ya que trajiste a colación esas palabras, por favor.
  4. Debido a 3., creo que me parece más que razonable proponer que, salvo contados casos, todas las pronunciaciones, regulares e irregulares, se generen automáticamente con el módulo. Esto ayudaría a mantener mayor neutralidad en el sitio, ya que a veces es molesto—al menos para mí—ver que en unas cuantas páginas aparece sólo una pronunciación que no es la propia. Con esta nueva versión, se reduciría el “sesgo” al incluír automáticamente las pronuciaciones más comunes. Además, la transcripción es fonética y no fonológica, por lo que la hace con mayor exactitud y considera todos los detalles extra de la pronuciación (por ejemplo, nasalización). Esto incluiría también que se determine automático: el tipo de acentuación, la cantidad de sílabas y letras, las rimas y la separación en sílabas (aún por implementar).
  5. Actualmente hay un máximo de 6 pronunciaciones posibles que se pueden obtener con el módulo: seseante+yeísta, seseante+sheísta, seseante+zheísta, seseante+lleísta, no seseante+yeísta, no seseante+lleísta. Si faltó alguna que crean que pueda valer la pena agregar, pueden comentarlo también.
  6. Habían ciertas preocupaciones de algunos errores groseros que habían en el módulo en inglés, como eso de que antes de [c] va [z], etc. Todas esas cosas están corregidas, no hay ninguna [z] en las pronunciaciones pues eso no es español. Sólo me llamó la atención que, según ellos, en la “hi” de “hielo” va [ʝ] en la pronunciación general, y [j] en la rioplatense. Yo lo simplifiqué a [j] para minimizar la posibilidad de errror (para que el módulo no lo confunda con la [ʝ] sheísta), pero igualmente si realmente existe esa diferencia dudo que alguien la pueda percibir.
  7. Aún falta testear el separador de sílabas, pero también está en mis planes implementarlo. Hay un único detalle menor y es que falta hacer una tabla de prefijos, de lo contrario palabras como “transatlántico” las separa "tran-sat-lán-ti-co" en lugar de "trans-at-lán-ti-co".
  8. ¿Cuál es el criterio que deberíamos tener para el generador de rimas? Aunque sé que puede entenderse en un sentido más laxo, yo lo tomé como las últimas dos sílabas de la palabra. Y como hay letras que tienen o pueden tener el mismo fonema asociado, se identifican en notación AFI. Como está ahora, sólo considera las rimas en la pronuciación más simplificada de todas -> seseante y sheísta. Y sí, podrán decir que algo de sesgo ahí hay, pero era lo más fácil de implementar. Otra opción es agregar las rimas en la pronuciación “normal”, pero hace más distinciones por lo que podría ir en contra del sentido de la herramienta. Dudo que a alguien le importe si una sílaba termina con [ɵ] o con [s] para considerarla rima de otra. Otra es incluír las rimas para todas las pronuciaciones, pero tendríamos doble categorización. Otra es sacar la sección de rimas, no sé... digan qué piensan.
  9. Una de las cosas que quería cambiarle a la plantilla en sí es que los parámetros que tienen la etiqueta nota vayan con nota al pie <ref>, pero no lo estoy logrando por ejemplo con οὐσία. @Peter Bowman: ¿sabés si hay forma de generar referencias al pie de página dentro de la plantilla, o si me equivoqué en algo?
  10. También tienen módulos para otros idiomas. Una vez que éste quede impecable y resuelva otras cosas más prioritarias voy a probar el que es para italiano.
Tmagc (discusión) 02:27 19 dic 2023 (UTC)Responder
Hola, @Tmagc, está quedando genial. El fallo con los <ref> era que el procesamiento de estos tags es posterior al del módulo Lua, luego este es incapaz de interpretarlos adecuadamente tal cual. Se soluciona de esta forma. Las rimas se colocan actualmente en la sección de "Información adicional" por medio de la plantilla {{rima}}, pero las puedo borrar con mi bot si finalmente van a tener cabida en pron-graf (tiene más sentido). Las sílabas que se deben considerar son la que contiene la vocal tónica y todas las posteriores (rima consonante); p. ej. para "noctámbulos" -> Categoría:ES:Rimas:am.bu.los. De momento no he tenido tiempo de mirar mucho más. Un saludo, Peter Bowman (discusión) 14:27 19 dic 2023 (UTC)Responder
@Tmagc: algo no va bien con las locuciones, salta un "Error de Lua en Módulo:generar-pron/es en la línea 532: attempt to compare number with nil." en casa matriz. Peter Bowman (discusión) 18:17 19 dic 2023 (UTC)Responder
Buenísimo, Tmagc. 3- ingey es bisílaba, la primera sílaba es i y la segunda es ˈŋej (o como se escriba el diptongo "ey"); chuico es bísilaba y no rima con cuico, porque la primera sílaba de chuico tiene el diptongo "uy" de muy; pasa algo similar con piure, en que la primera sílaba no rima con la primera de viuda; en xoconostle está bien indicar la variación de x, pero por algún motivo se muestran dos posibilidades distintas para tl. 4- Totalmente de acuerdo. 5- Eso parece lo mínimo y quizás lo máximo. 6- A mí me parece una aberración científica considerar que la /s/ no aspirada de "desde" o "resbalar" es [z], pero parece que es la opinión mayoritaria o más prestigiosa; lo de hielo es un error, tanto en rioplatense como entre los demás es [j], ahora si eso es /i/ o /j/ no lo puedo decir (par mínimo al menos chileno: yerba = yerba mate en primer lugar vs hierba = algunas de las otras), pero lo que sí es rioplatense parece ser iodo (creo que nunca shodo/zhodo). 7- Fuera de tema, se supone que el silabeo general es tran-sa-tlan-ti-co (veo que hay un problema con atleta en el silabeo y en còmo se muestra la forma con t͡ɬ ¿inventada por la RAE?, faltaría la forma general [a'tle.ta]. 10- ¡Genial! Saludos y gracias otra vez. Lin linao ¿dime? 03:04 20 dic 2023 (UTC)Responder
Hola, Tmagc. Ahora está unificado xoconostle, pero todavía no se bien ingey. La ayuda no debería ser inguey porque no tiene [g], su única consonante es la nasal velar que inicia la segunda sílaba. Las palabras con este sonido deben ser menos de 20 (más, tal vez, las con -ing para algunos), ¿podría funcionar una ayuda=iŋey? Saludos. Lin linao ¿dime? 12:55 20 dic 2023 (UTC)Responder
Otro caso especial: thrauna y pithrel. Los distinguidores usa(ba)n [tɹ] o algo similar para la secuencia thr, el silabeo es pi threl. Saludos. Lin linao ¿dime? 15:34 20 dic 2023 (UTC)Responder
Estuve revisando el módulo y me había parecido un poco mezquino poner una única ayuda, así que agregué la posibilidad de poner varias ayudas para pronunciaciones diferentes. En cuanto a ingey, suponguqe que no quedará otra que poner como ayuda iŋey, pero aún así no va a saber decidir si separarla como iŋ-ey o i-ŋey. Así que probablemente haya que cargarla manualmente y supongo que thrauna y pithrel también. Lo de atleta es porque los fonemas estaban cargados manulamente, eso no había sido culpa del módulo, ya lo corregí aunque sigue separando mal (a-tle-ta en lugar de at-le-ta), también voy a revisarlo. Seguiré trabajando, saludos. Tmagc (discusión) 16:00 20 dic 2023 (UTC)Responder
Quizás se resolvería con ayuda=iŋey porque una secuencia VCV generalmente se silabea V-CV. ¿No es la separación general a tle ta, con la excepción de España y tal vez Puerto Rico? Una duda lingüística, ¿t̪ es interdental? ¿y en ese caso no debería estar al revés: ausente en atleta y presente en cantar? Saludos. Lin linao ¿dime? 17:22 20 dic 2023 (UTC)Responder
Revisé bastante de lo que me dijiste. Lo de la “thr” está resuelto. Lo de la “t” interdental, en el caso de cantar no se mostraba porque la plantilla había sido llamada con parámetros. Hay que limpiar los parámetros para que se genere automático.
Lo que falta revisar:
  1. todavía sigo sin entender la diferencia entre cuico y chuico, creo que va a ser más fácil que completes manualmente las plantillas o me respondas exactamente cómo debería ser. Según como está ahora, las palabras riman.
  2. creo que la pronunciación de ingey está bien, pero separa en sílabas mal.
  3. lo de la t interdental no encontré información, como está ahora siempre debería mostrarla interdental.
Tmagc (discusión) 02:00 21 dic 2023 (UTC)Responder
1. Cuico es ['kwi.ko], está bien, pero chuico debería ser [ˈt͡ʃui̯.ko] o [ˈt͡ʃuj.ko], como sea que se escriba el diptongo "uy", el opuesto de "wi". Pasa lo mismo en el caso de piure, que lleva el diptongo "iw", no "ju" como en piurano. Audio. Ehm, una noticia de piures y un audio de una voz más ilustre hablando de un chuico.
2. Sí, gracias, era eso. Saludos. Lin linao ¿dime? 02:16 21 dic 2023 (UTC)Responder
Ahora sí, comprendo la diferencia, pero no sé cómo resolverlo. Si no hay ninguna regla para decidir si debe ser “iw” o “ui”, si es irregular, entonces habrá que establecer alguna convención para escribir las ayudas y que se genere correctamente. O bien, dejar uno como regular y en los casos en los que se da el otro introducir manualmente la ayuda. O bien, hacer ambas cosas. Mientras tanto, lo pensaré durante un tiempo. Tmagc (discusión) 03:36 21 dic 2023 (UTC)Responder
Lo regular dentro de las palabras es wi y ju y las excepciones son muy pocas, menos de diez quizás. ¿Cómo se resuelve en final de palabra? Ahí tenemos varias cosas como inmiscuí y uyuyuy y una lista corta de cosas como mañiú y mañíu. Pensé en escribir chúico en la ayuda, pero no funciona. Saludos. Lin linao ¿dime? 15:32 21 dic 2023 (UTC)Responder
@Lin linao Creo que ya sé la regla: la mayoría de las palabras con la grafía “uy” se pronuncian /uj/, mientras que las que tienen “ui” se pronuncian /wi/. Si es así, la ayuda podría ser “chuyko”. Pero hay que cambiar entonces esa parte en el módulo. Tmagc (discusión) 14:37 22 dic 2023 (UTC)Responder
Sí, eso puede funcionar, también lo habia probado sin éxito. ¿Y si se usaran guiones u otro signo en la ayuda para inducir separacionew de sílabas? Mmmm, quizás serviría en ingey, el famoso salle (de salir), subrayar, subrogar y otros, pero no en "chuyco", a menos que se hiciera algo para no afectar la acentuación. Saludos. Lin linao ¿dime? 15:30 22 dic 2023 (UTC)Responder
@Lin linao Lo de chuico está resuelto, ahora “uy” se convierte a /uj/ mientras que “ui” sigue /wi/. En cuanto a lo del prefijo sub-, volvemos a lo que dije anteriormente: la única opción es armar una tabla con prefijos conocidos y separarlos antes de hacer los demás pasos del algoritmo. En realidad, detectar los prefijos no es tan trivial como parece porque “transatlántico” es trans-at-lán-ti-co, pero “transar” es tran-sar. Está explicado en este documento. En algún momento lo voy a hacer, pero primero estoy revisando detalles más importantes. En cuanto a poner separadores en la ayuda, así como está implementado ahora no va a ser muy útil porque el algoritmo en primer lugar convierte las letras a fonemas y después separa en sílabas. Si lo hubiera hecho desde cero, lo hubiese hecho al revés: primero separar en sílabas y después convertir a fonema, probablemente sería más eficiente porque ahora tiene que separar en sílabas dos veces, para generar la pronunciación y para mostrar la silabación. Pero bueno, tampoco tengo tanto tiempo como para hacer eso, qué se la va a hacer...Tmagc (discusión) 15:39 23 dic 2023 (UTC)Responder
Buenas otra vez, debo hacer algunas aclaraciones adicionales a los 10 puntos anteriores:
11.
Por si no quedó claro, reitero que de acuerdo a los puntos 4. y 10. , tengo pensado (antes de haber hecho otras cosas) implementar los módulos de esta página que ya hayan sido testeados y estén funcionando correctamente. Son más de doscientos.
Pongo algunos por los que voy a comenzar: afar, akkadio, aragonés, griego clásico, inglés clásico, árabe, asamés, asturiano, bielorruso, catalán, chino mandarín (+ alguna que otra variante de chino), vasco/euskera, finés, francés, hausa, hawaiano, hiligayno, italiano, latín, rumano, ruso, eslovaco y serbio.
Hay un segundo grupo en donde aún no está claro que los módulos funcionen al 100% pero muy probablemente los revise y tarde o temprano sean implementados también, por ejemplo: alemán, azerí, bávaro, bikol, persa, guaraní, islandés, japonés, coreano y hebreo.
Para el inglés no implementaron módulos, aunque con los idiomas “irregulares” se me ocurrió que se podría dar un paso aun más radical e implementar un bot que copie las pronunciaciones de otros wikcionarios si ya existen, o bien de algún otro sitio de confianza. Yo no veo el problema de hacerlo, los símbolos fonéticos son prácticamente universales y comunes a todas las wikis. Lo más importante son las definiciones, para eso siempre va a necesitarse gente que agregue nuevas y revise las que ya están.
El punto es el siguiente: sean todos o algunos, si leen entre líneas lo que dije antes, sobre todo en los idiomas “regulares” en donde se implementen módulos automáticos con éxito es probable que esto conlleve asimismo ir borrando de a poco y ordenadamente las transcripciones hechas a mano. Por lo tanto, también pido al menos que para este grupo de idiomas “regulares” no agreguen más pronunciaciones y en todo caso, avisen de los defectos que vayan encontrando en los módulos. Ya notifiqué a algunos fuertes contribuidores de todo lo relacionado con la pronunciación como @PFSV-UY, @Jemily1, y por las dudas vi muchas también de @Ivanics. En el caso del español, lo automático es la pronunciación, la separación en sílabas, la acentuación, la cantidad de sílabas y letras, y la rima. Lo demás: grafías alternativas, homófonos, etc, por ahora queda para agregarse manualmente. En los demás idiomas se agrega sólo la pronunciación, salvo quizá alguno que otro en donde esté implementado también alguna de las otras cosas. PEro lo voy a ir avisando.

Voy a esperar un buen tiempo para hacer todo esto y voy a ir haciendo otras cosas por mientras. Pero si alguien está en contra total o parcialmente, es el medio por el que lo pueden comunicar.

12.
@Lin linao Debo retractarme: la [z] para la “s” sí existe en el español; cambié de convicción cuando me mostraron esto. Está en algunos acentos de España, que son los que suelen tomar como referencia. Pero yo no veo evidencia clara de que sea un fenómeno general, y si es por eso más común creo que es la aspiración de la “s” como [h]. Pero por ahora implementar esas distinciones sería irse un poco por las ramas y hay cosas más prioritarias. También me dijeron que es inmoral lo de incluír ”thr“ porque, en el fondo e independientemente de lo que pueda decirse, eso es mapuche y no español. Lo voy a pensar y tener en consideración si quitarlo o no. Te recomiendo ver (o participar; yo ya me harté de hacerles entender que no hay distinción entre [j] y [ʝ] tal como ellos sostienen) esta discusión que tuve.
13.
Cambié la apariencia de la plantilla para usar dos columnas. El problema de antes es que las palabras no quedaban bien alineadas. Como ahora sí tiene formato “tabla”, saqué los dos puntos y puse negrita para distinguir los campos. Para mí la plantilla llama demasiado la atención, si fuese por mí sacaría incluso la negrita y pondría algún tipo de borde que ayude a distinguir las filas y columnas. Pero es secundario y hay cosas más importantes que hacer. También vale opinar sobre la apariencia del cuadro. Tmagc (discusión) 23:40 23 dic 2023 (UTC)Responder
11. En el futuro lejano, cuando hayas hecho esos idiomas, puedo aportar una tabla de conversión del mapuche al AFI, porque tiene 3 ortografías casi casi regulares y casi casi intercambiables. 12. ¡Rayos! Hace menos de una semana vi el título de un artículo científico que sugería que al fin a alguien se le cayó la teja con esta afirmación tan extraña e investigó lo que pasaba. Recuerdo algo como "¿Es realmente [z] un alófono de /s/ en español? Reanálisis de no se qué" (en castellano o inglés), pero no encuentro ni eso ni algo parecido. Es difícil que pueda encontrarlo buscándolo, porque ni siquiera me imagino dónde pude haberlo visto. El alófono [z] de /s/ existe en dialectos andinos, sobre todo en Ecuador y en la zona paisa, pero entre vocales: "los Andes" es [lo'zandes] en los Andes ecuatorianos, pero eso no hace falta para pron-graf. En el caso de palabras como "mismo" o "desde", yo diría que es un tipo de fricativa no sonora (compárala con la [z] del inglés en palabras como el verbo house), pero habría que revisar los análisis acústicos publicados. En cuanto a esa thr de pithrel, la usa(ba)n hispanohablantes monolingües como fonema en palabras de origen mapuche en un área en que el mapuche se extinguió hace 100 años o más. Es distinto a la variación libre que usa el común de los chilenos del centro-sur en todas las palabras con tr, como "...la reforma tributaria que trajo...". Esta thr aparece incluso en préstamos que parecen no tener el sonido en mapuche, al menos en los registros escritos: map.: chuva -> cast.: thruga (p. 412) -> trúa / chùa. Hará unos 20 años alguien de unos 20 años me escuchó decir "traumán" con tr corriente y me replicó "thraumán", esas dos y chaumán son las formas actuales de "thraumamen" (p. 410), a su vez derivado del mapuche trarumamüll (p. 227). Y chapalele viene de thrapalele (p. 410), que a su vez viene de ¿qué? ¿chaparün (p. 17) con sufijos?. Me parece difícil sostener que "thraumán" y "thrapalele" sean palabras en mapuche y no en castellano. Sea como sea, el total de palabras con thr y ng registradas en los diccionarios no llegará a 100, es una excepción menor entre las excepciones, algo para pulir el módulo, pero no esencial para el buen funcionamiento de pron-graf en términos generales. La verdad es que no me dan ganas de intervenir en lo de la [j]. Creo que tú tienes razón, representar hielo como /ˈʝelo/ [ˈɟ͡ʝe.lo] me parece una gran equivocación. Distingo claramente entre "yerba" y "hierba", entre "y eso" y "yeso" y hay gente que se burla o profesores que corrigen a quienes dicen "yelo", "yena" o "Mayami" (porque sí existen quienes no distinguen, como dicen en en:wikt, pero no es lo corriente). Internet está /'ʝe.no/ de mexicanos, colombianos y demaes haciendo tragos con /'je.lo/, seguramente ya alguien habrá investigado el carácter fonético y fonológico de hia, hie y la (no) diferencia entre el rioplatense y los demás. ¿Cómo explicarán los editores de en:wikt la brutal diferencia acústica entre "inyectar" o "un llanto" frente a "un hiato" o "con hielo"? ¿o a esta usuaria española de Forvo cuando dice hielo, hierro o vaya día llevamos...?). En fin, gracias por todo esto y que pases felices fiestas. Saludos. Lin linao ¿dime? 05:31 24 dic 2023 (UTC)Responder
Adicionalmente, podría ayudar en toki pona, es un idioma artificial, por ende, no tiene variantes regionales, así que se podría hacer también pues es regular. Felices fiestas, PFSV-UY (discusión) 17:27 24 dic 2023 (UTC)Responder
@Lin linao @PFSV-UY Sería buenísimo agregar las pronunciaciones para esos idiomas, no los vi en el sitio en inglés así que sería un gran distintivo. Les propongo lo siguiente: cuando puedan, pásenme algún documento que tengan o hayan encontrado con las equivalencias entre letras y fonemas, así implemento los módulos. Sino, escriban en un excel, o mejor aun en un .csv, en una columna, la o el grupo de letras y en la otra el fonema equivalente. Pueden agregar una tercera columna con comentarios, por ejemplo si una letra tiene dos fonemas equivalentes, ej. (|columna1|columna2|columna3|): |tr|ʝ|-| ; |b|z|cuando está precedido por vocal| ; |b|s|cuando está precedido por consonante|; y así para cada letra o grupo de letras.
Gracias por la información y los aportes. Saludos, y felices fiestas. Tmagc (discusión) 21:50 24 dic 2023 (UTC)Responder
De hecho, todas las letras del toki pona son exactamente iguales a su fonema en afi, m es /m/, o es /o/, etc. Aquí hay un poco de información de su fonología: https://jan-ne.github.io/tp/phonology. ¿Sigue siendo necesario mandar un excel? Gracias, PFSV-UY (discusión) 18:28 25 dic 2023 (UTC)Responder
No, si es así está bien. Eso es muy fácil de automatizar. Cuando tenga tiempo lo agrego, gracias. Tmagc (discusión) 01:29 29 dic 2023 (UTC)Responder
También agrego ejemplos para ilustrarlo mejor: alasa, esun, ijo, toki. PFSV-UY (discusión) 18:30 25 dic 2023 (UTC)Responder
Hola de nuevo, por ahora me parece muy bueno el módulo, aunque sé que no está aún terminado, y que aún falta por implementar los otros idiomas, sin embargo tenía una duda menor, ¿por qué en hornblenda la n aparece como /m/? Quizá sea alguna característica fonética que desconozco del español, por eso quería saber. Un saludo, PFSV-UY (discusión) 05:35 5 ene 2024 (UTC)Responder
Hola, @PFSV-UY. Esto ocurre por ejemplo en palabras como enviar, convertir, invitar... De w:Transcripción fonética del español con el Alfabeto Fonético Internacional#Consonantes, nota 20:

[m] ocurre cuando /N/ está en sílaba trabada con una consonante bilabial /b/, /p/ (así como la variante dialectal de /f/, [ɸ]) y nasal /m/; convertir [kõ̞mbe̞ɾˈtiɾ], inmoral [ĩmmo̞ˈɾa̠l].

Creo que existe alguna regla ortográfica según la cual debemos escribir nv (y no mv) pese a que se pronuncie /m/ de acuerdo con lo anterior. La combinación de consonantes nb no debe de ser muy frecuente, así que me pregunto si hornblenda no será una excepción (yo de primeras lo pronunciaría como /nb/). Un saludo, Peter Bowman (discusión) 10:42 5 ene 2024 (UTC)Responder
@PFSV-UY @Peter Bowman Personalmente, yo pronunciaría “nv”, "nb" y “np” como “mb” y “mp”; pero “nm” la pronuncio tal cual (/in.mo'ral/, /in.mo'lar/). Lo de “nv” es un detalle menor que lo arreglaré cuando pueda, cuando haya terminado de hacer algunas cosas más importantes. Saludos. Tmagc (discusión) 01:24 10 ene 2024 (UTC)Responder
@Tmagc: en principio sería [mm], igual que hace enwiktionary: en:inmoral#Spanish. Un saludo, Peter Bowman (discusión) 11:14 10 ene 2024 (UTC)Responder
No sé si es a propósito, pero los audios no funcionan si no tienen información fonética (fono= o fone=), ¿es intencional? Ej. zorge. Un saludo, PFSV-UY (discusión) 18:05 6 ene 2024 (UTC)Responder
@PFSV-UY Sí, por el momento está hecho para que sólo se muestre si está la transcripción. Con respecto al audio, quisiera achicar el botón porque así como está arruina la estética de la tabla; debería aparecer al lado de la transcripción y no abajo. Tmagc (discusión) 01:21 10 ene 2024 (UTC)Responder
@Tmagc: me he fijado en que el parámetro alt no funciona, para idiomas como el latín o el hebreo es importante recuperarlo (p.ej. multo, יהושע). Peter Bowman (discusión) 23:38 18 ene 2024 (UTC)Responder

Quitar el parámetro |altNpron de la plantilla {{pron-graf}}

Buenos días. De acuerdo a lo que mencioné de hacer un módulo que genere las pronunciaciones regulares en español, ahora mismo estoy trabajando en una nueva versión de la plantilla {{pron-graf}} que sea implementada con Lua. La pregunta es si tienen problema con que quite de la plantilla el parámetro que menciono ya que: 1. me simplificaría bastante la programación y 2. de todas formas no veo cuál es la utilidad que tiene. Estoy viendo las páginas que lo usan y en todas las que vi hasta ahora es siempre lo mismo: cambiar la apariencia de las etiquetas más triviales y comunes que pueden haber (“seseo”, “yeísmo”, etc. por “seseante”, “yeísta”, etc.). ¿No hubiese sido más fácil hacer coincidir al parámetro |pron con una serie de expresiones (seseo, seseante, s, etc.) que mapeen a una única y misma etiqueta? Así como está da una libertad que le quita parte del sentido a la plantilla porque hay unas cuantas páginas que dicen “seseo” y otras cuantas que dicen “seseante”, en lugar de unificar a un único rótulo.

En cuanto a los demás parámetros “alt” (|ealt, |galt, |valt) no tengo problema en dejarlos pero su utilidad tampoco está tan clara. Las páginas que los usan son casi 400. La mayoría son del latín y es para agregar los macrones a los enlaces, ¿no sería mejor que los enlaces coincidan con el título de la página y en todo caso dejar sólo |alt para modificar el título que se ve cuando se invoca a la plantilla? Tmagc (discusión) 13:55 18 dic 2023 (UTC)Responder

Hola, @Tmagc. Salvo que veas un caso muy particular en el que vendría bien tener esa posibilidad, por mi parte altNpron puede desaparecer, pues por lo general me parece una complicación innecesaria; me gusta la idea del mapeado automático en su lugar. En cuanto a alt, también se emplea en locuciones, para enlazar a cada palabra por separado. ¿A qué te refieres con lo de que "los enlaces coincidan con el título de la página"? Peter Bowman (discusión) 14:45 18 dic 2023 (UTC)Responder
@Peter Bowman: De acuerdo. En cuanto a tu última pregunta, supongo que para el latín en algún momento hubo alguna convención de poner los títulos de las págians sin diacríticos y ponerlos en la pronunciación. Tomo como ejemplo munitus. Aparece “mūnītus” en el título del cuadro de la plantilla, y se menciona la variante moenītus. ¿No sería mejor que aparezca moenitus, y que en todo caso en su respectiva página figure “moenītus” en el título del cuadro de su plantilla de pronunciación? Tmagc (discusión) 14:52 18 dic 2023 (UTC)Responder
Gracias, @Tmagc, ya lo veo. Incluir esa información evita la necesidad de visitar otra página, cosa que de todos modos sería imposible en este caso dado que moenitus todavía no existe, luego de eliminar valt estaríamos perdiendo información. Además, los macrones se indican en más lugares, entonces por qué no también en pron-graf. Peter Bowman (discusión) 14:56 18 dic 2023 (UTC)Responder
Normalmente ealt o galt son usados para añadirle diacríticos cuando en el título de la página por convención no llevan, así como mencionaban como en el latín. Por otro lado, alt= es útil en locuciones, pues añadía un enlace a cada palabra de la locución, como alternativa al haber quitado la etimología (no poner "compuesto de p1, p2 y p3"). PFSV-UY (discusión) 17:46 2 ene 2024 (UTC)Responder
@Peter Bowman Necesito que por favor hagas algo también con todas estas páginas. En casi todas ellas la plantilla pron-graf se llama con el parámetro altpron y por lo tanto las etiquetas de pronunciación que quedaron son incorrectas. Para mí, lo mejor y los más simple es blanquear todas las invocaciones a la plantilla. Sé que suena muy nazi pero ya te robé suficiente tiempo con otras dos solicitudes más. De lo contrario, hay que limpiar todos los parámetros excepto |audio, |ts, |tl, |e, |g, |v, |h, |p, |s , considernado sus sobrenombres. Pero no sé qué tan sofisticado es tu bot para parsear. Saludos. Tmagc (discusión) 03:56 22 ene 2024 (UTC)Responder
El problema de dejar los audios es que muy probablemente no vayan a concordar con los títulos y pronunciaciones autogeneradas por el módulo. Si vas a hacerlo de la forma sofisticada, mejor dejá sin procesar las plantillas con audios y después lo hago yo a manopla. Tmagc (discusión) 12:39 22 ene 2024 (UTC)Responder

Agregar idiomas faltantes y re-elaboración del módulo lengua

Hola otra vez. Les propongo dos cosas relacionadas aunque pueden implementarse de forma independiente. Lo primero: quiero agregar todos los idiomas que faltan. Son cerca de 8000. Lo siguiente habría que discutirlo, pero en principio sería bajo las siguientes reglas:

- Habrían dos tablas: una de idiomas y protoidiomas (para etimologías) y otra de familias de idiomas que se usaría meramente para clasificar pero no aparecería explícitamente en las páginas.

- Se respetan los códigos ISO de 3 letras (ISO-639-3), salvo para los idiomas que tengan código ISO de 2 letras (los más comunes). Para los idiomas que no tienen código ISO, si fueron agregados se mantiene el código que tenían, y para los que faltan me basaría en los códigos que aprecen en el sitio en inglés.

- Tendría más sentido y sería más regular renombrar los códigos de protoidiomas con el sufijo (o prefijo, lo que prefieran) “-pro”, tal como está en el sitio en inglés. Esto evitará algunas colisiones con algunos idiomas y sus respectivos protoidiomas en donde sino debería repetirse el mismo código :(.

- Respecto del punto anterior hay algunas irregularidades, hasta ahora vi dos protoidiomas sin el sufijo “-pro” (ine y trk, que deberían ser “ine-pro” y “trk-pro”), como así también creo haber visto algún que otro idioma con un código diferente al ISO. En una primera instancia, dejería ambos códigos como válidos, con el objetivo de migrar en algún momento los que sean irregulares. Me aseguré de que por el momento se mantengan los códigos de los idiomas que han sido registrados hasta la fecha.

- ¿Cuál sería el criterio para nombrar a los protoidiomas? Según tengo entendido en castellano se escribe el prefijo junto al idioma sin espacio ni guiones, pero queda medio raro cuando el idioma no es un gentilicio y es un nombre propio (por ejemplo: proto-hmong).

Lo segundo: en lugar de tener todas las plantillas desparramadas, hacer una implementación a la francesa y juntar todo en una tabla que sea accedida por el módulo que busca el código del idioma. Esto implicaría hacer algunas modificaciones al módulo lengua. En el sitio francés se usa. En el sitio en inglés tienen una tabla similar, aunque la implementación es más oscura y difícil de entender. Esto permitiría además generar automáticamente una tabla con los códigos de idioma para mostrar la cual sería actualizada automáticamente. Algo similar a lo que hice en su momento con los caracteres Unicode.

Quisiera oír sus opiniones, y si la respuesta es un sí necesitaría saber qué otros módulos o plantillas que usen las plantillas de idiomas se podría/habría que tocar. Saludos. Tmagc (discusión) 16:13 22 dic 2023 (UTC)Responder

Hola, @Tmagc. Por lo general no tengo nada en contra, pero... paso a paso :). Hay varios hilos abiertos que conllevan realizar cambios muy profundos, y todavía están surgiendo cosas como esta con las últimas modificaciones en pron-graf: [21]. Peter Bowman (discusión) 13:50 23 dic 2023 (UTC)Responder
Buenas, estoy ordenando y traduciendo los códigos de idiomas que se usan en en.wiktionary , además de compararlos con los códigos que tenemos. Ya comenté que por consistencia algunos códigos serán migrados; las páginas afectadas son relativamente pocas y me puedo encargar. No obstante, hay tres casos en donde me gustaría unificar códigos:
  1. El galo cisaplino (xcg) y el galo transalpino (xtg) son dialectos del galo. Ambos códigos deberían ser unificados a uno nuevo que represente simplemente el galo; en muchas entradas etimológicas se usan ambos indiscriminadamente y no queda lo suficientemente claro que quien lo escribió fue consciente de tal distinción existente.
  2. El croata, serbio, bosnio, montenegrino y caicavo son todos dialectos del serbocroata (sh). Las páginas que contengan estos códigos deberán ser migrados todos al serbocroata y quizá a lo sumo utilizar la plantilla de {{ámbito}} para indicar si la palabra es regional.
  3. Por lo que veo, todos los códigos de las variedades de quechua parecerían más bien representar dialectos más que idiomas diferentes. Deberían unificarse, probablemente dejando más de un código. En el sitio en inglés dejaron el quechua, el quechua clásico y el inga; lo cual me parece un error ya que el último suele considerarse dialecto. Estuve buscando información y al parecer hay dos divisiones claras [22], quechua I y quechua II. Quizá podríamos hacer cuatro códigos: dos para estas lenguas, uno para el supuesto “protoquechua” y otro que sólo sirva para referirse a la familia o macrolengua.
Pueden ver más información acerca de las discusiones en en.wikt acá.
Lo único que voy a agregar, que encontré en un comentario, es que ISO sólo cataloga los códigos básicamente en función de lo que le van pidiendo; pero ellos no son expertos en el tema. Por lo que es una pésima idea guiarse por el criterio de “1 código ISO = 1 idioma”. Hay idiomas que aún no tienen código, hay idiomas espurios que aún tienen código y hay lenguas que en realidad son dialectos pero también tienen código.
En el sitio en inglés implementaron tres tipos de códigos: uno para idiomas, otro para familias y otro para “idiomas etimológicos”. A mí esta distinción me parece una complicación innecesaria. Se supone que los últimos se permiten sólo para indicar la etimología, pero aún así es algo que costaría que todos se acostumbren e igualmente veo que sólo complica la implementación, ya que hay muchos de estos idiomas que nunca fueron utilizados [23]. Para mí, o es idioma o no lo es. Para las palabras regionales ya tenemos la correspondiente plantilla que las clasifica.
Lo que me gustaría saber es que opinan sobre todo de 1. 2. y 3. Sobre todo del quechua, que afectará a una gran cantidad de páginas. ¿Ya tuvieron alguna discusión al respecto? Si nadie responde, dentro de unos días implementaré el módulo y procederé con esto como mejor lo considere. Tmagc (discusión) 01:40 3 ene 2024 (UTC)Responder
Hola. Respecto al 2, ten en cuenta que es una interpretación de la comunidad de enwikt. En plwikt, por ejemplo, hemos decidido separar la macrolengua en esos cuatro o cinco idiomas/dialectos. Creo recordar, sin embargo, que la opinión mayoritaria entre lingüistas es la de mantener vivo el serbocroata; también es una decisión pragmática si la trasladamos al terreno de Wikcionario, de modo que estoy de acuerdo contigo. Respecto a los tres puntos en su conjunto, avísame cuando necesites realizar cambios en masa para que los lleve a cabo con mi bot. Peter Bowman (discusión) 10:20 3 ene 2024 (UTC)Responder
@Peter Bowman Con respecto a eso, ¿tu bot puede correr cosas en Python? Estuve tratando de revisar tu wikibot pero de Java sé poco y nada y tuve problemas para importar esa biblioteca de wikipedia (para analizar wikitexto) que usás. Estaba pensando que sería un golazo; podría pasarte listas de títulos de páginas junto con el código Python a ser ejecutado en c/u. ¿Cómo lo ves? Quizá pueda traducir tu algoritmo a Python y usarlo como punto de partida. Tmagc (discusión) 18:22 3 ene 2024 (UTC)Responder
@Tmagc: puedo ejecutar código Python, pero no tengo tanta soltura con pywikibot. En primer lugar, optaría por usar mi implementación dado que la manejo mejor y tengo un parser adaptado a Wikcionario. Peter Bowman (discusión) 19:31 3 ene 2024 (UTC)Responder
Sobre el 2, creo que no se debería hacer todavía, pues aún es un tema debatible y muchos lectores conocen más al Croata o Serbio, que al Serbocroata. Yo creo que podríamos en todo caso hacer votaciones en Wikcionario con ese tema.
Por otro lado, ¿qué piensas hacer con idiomas que tienen más de un código de idioma en Wikcionario en español? Me refiero a casos como el Mandarín (zh y cmn) o el Zazaki (diq y zza).
Por último, un detalle que siempre lo noté pero no le puse atención: nl en la plantilla 'lengua' es Neerlandés, pero en 'etimología' aparece como holandés. ¿Cuál denominación prefieres?
¿Estos cambios que planeas hacer afectarán a la estructura clásica o no tengo que preocuparme por cambiar mucho, como en pron-graf que fue fácil el cambio? Pregunté mucho pero bueno, un saludo, PFSV-UY (discusión) 22:07 3 ene 2024 (UTC)Responder
Por otro lado, ¿quieres simplemente hacerle cambios a la plantilla lengua o quieres pasarla a un módulo? PFSV-UY (discusión) 22:12 3 ene 2024 (UTC)Responder
@PFSV-UY Quiero unificar las plantillas de idiomas en un módulo. La idea es hacer algo similar a una tabla en donde queden guardados todos los códigos con sus respectivos nombres y cierta información adicional que pueda ser útil, como denominaciones alternativas. Esto permite que a la larga sea más fácil de mantener y hacer cambios. Además, en la página con la lista de códigos de idiomas será mostrada una tabla automáticamente a partir de la información guardada en estas tablas en lugar de tener un bot que revise si hay plantillas nuevas.
Por lo tanto, el nombre canónico para “nl” podría ser “holandés” y en la tabla de la página que muestre todos los idiomas poner “neerlandés” en la columna de “otras denominaciones”. O viceversa, como prefieras(n).
En cuanto a 2. , el motivo es más que nada pragmático. Creo que ellos no reconocen el serbocroata por cuestiones nacionalistas, pero la mayoría concuerda en que son lo suficiente inteligibles para ser considerados un único idioma. Todas estas unificaciones las estoy anotando para que quede constancia; los códigos no van a “desaparecer” sino que van a aparecer esos cinco códigos en la tabla de códigos pero marcados como “prohibidos por ser dialectos del serbocroata (sh)”. Por lo tanto, quienes no lo conocen lo podrían encontrar fácilmente en la página con la lista de códigos al buscar “croata”, “serbio”, etc. verán que los mandará al serbiocroata. Y en todo caso, si desean marcar una palabra específica para el serbio, croata, etc. para eso está la plantilla de ámbito.
Gracias por avisar lo de los códigos duplicados, no me había percatado. Si realmente son duplicados hay que unificarlos, preferentemente al código estandarizado ISO de 2 letras, sino al de 3 letras. Y justo mencionaste el chino lo que me lleva a agregar un caso más:
4. En en.wikt usaron “zh”, que es el código de la macrolengua china. Pero, ¿cómo hacemos con esto? Hace un tiempo se hizo una votación para unificar todo en un único código y tratar las variantes como dialectos por motivos más que nada pragmáticos. Sin embargo, aunque se haya unificado todo, el debate no parece estar claramente resuelto. Creo que por las dudas conviene mantener las variantes como idiomas separados, pero no estoy seguro.
Por último, cambiará sólo el “backend”. La utilización de las plantillas de idiomas en el editor sigue siendo la misma que antes, sólo que algunos códigos cambiarán. Tmagc (discusión) 14:41 4 ene 2024 (UTC)Responder
Yo creo que me quedaría con nl=neerlandés como nombre canónico, por algún motivo la RAE define el holandés como un dialecto de este ([24]). Esto también evitaría tener que reordenar muchas secciones de idioma. Peter Bowman (discusión) 15:32 4 ene 2024 (UTC)Responder
También considero al neerlandés como mejor opción. En cuanto a los códigos del croata, bosnio y serbio, ¿piensas hacer algo como pasa ahora con el código cz, que al ponerlo en la plantilla lengua, te sugiere cs? Supongo que es también una alternativa a tener en cuenta y sería útil para quienes desconocen del tema.
Por otro lado, hay que tener cuidado con esta plantilla, pues a diferencia de pron-graf, es muy utilizada en todo Wikcionario. Sobre el tema de Zazaki, veo que zza es el código de la lengua, y diq es el código de un dialecto de la misma, algo así como "Zazaki meridional", según Wikipedia en inglés, por lo que se mantendría zza y diq se eliminaría o renombraría, pero igualmente ese es el menor de los asuntos.
Sin querer molestar más, les digo que me comprometo a trasladar todas las entradas bosnias, croatas y serbias al Serbocroata si esto procede. Un saludo, PFSV-UY (discusión) 05:13 5 ene 2024 (UTC)Responder
Otro tema, cuando pongas los códigos, no te olvides del código trans (Translingüistico). PFSV-UY (discusión) 17:31 5 ene 2024 (UTC)Responder
@PFSV-UY No sé qué tan sofisticada es la plantilla actual, lo que haré por el momento es ponerlos en una lista de “códigos prohibidos” y por lo tanto el módulo arrojará un error genérico. Más adelante, cuando tenga más tiempo puedo terminar de pulir esa parte para sugerir el código de idioma correcto. Igualmente reitero: la lista de códigos prohibidos va a aparecer junto con la lista de códigos normales por lo tanto cuando busquen “bosnio” lo van a encontrar y van a ver por qué no se usa. Lo demás lo tengo en cuenta, y no vas a tener que trasladar nada; las migraciones masivas las vamos a hacer con el bot de Peter. Tmagc (discusión) 13:40 6 ene 2024 (UTC)Responder
5. Actualmente tenemos códigos para el emiliano, el romañol y el emiliano-romañol. Similar a lo que sucede con el serbocroata, sugiero adoptar la estrategia más pragmática y unificar los tres a emiliano-romañol. A menos que alguien se oponga, es lo que haré. Tmagc (discusión) 13:42 6 ene 2024 (UTC)Responder
Hay que tener en cuenta que muchos del serbocroata ya están duplicados, es decir, la misma palabra está tanto en "Bosnio" como en "Serbocroata". Sobre el emiliano-romañolo, y creo que también hablaste del quechua, no tengo una opinión sólida pues no conozco los idiomas. Un saludo, PFSV-UY (discusión) 17:56 6 ene 2024 (UTC)Responder
Actualización: Sigo trabajando en el módulo, está llevando más de la cuenta recopilar todos los códigos y compararlos para analizar la consistencia. Hay otro asunto más que debo mencionar:
6. El quinqui/romanó ¿lo consideran un idioma o un dialecto? En en.wikt lo consideran un idioma pero al no ver el código acá, o nunca agregaron ninguna palabra o están mezcladas con el español. Agradecería si alguien que sepa algo responde. Tmagc (discusión) 01:18 10 ene 2024 (UTC)Responder
Actualización: Si ya se dieron cuenta publiqué la primera versión. Las decisiones que tomé (o que voy a tomar) fueron
  1. unificar el galo (eran pocas páginas)
  2. unificar al serbocroata
  3. no unificar el quechua ante la duda; pero armé subdivisiones jerárquicas en el archivo de familias
  4. no unificar el chino, ante la duda
  5. unificar el emiliano y el romañol
  6. no unificar el quinqui
  7. diversas migraciones de códigos entre las que cabe destacar trans -> mul, es el código estándar para translingüístico y vendría bien para tener todos los códigos de 2, 3 o 6 letras.
modifiqué Wikcionario:Códigos de idioma para que vean cómo quedaría. Expliqué brevemente cómo serían las nuevas reglas para el uso y modificación de códigos. Si no hay objeciones, entonces @Peter Bowman lo antes que pueda te paso la tabla con todas las migraciones de códigos para hacer. Apenas estén hechas voy a modificar el Módulo:lengua y demás plantillas necesarias. Supongo que voy a necesitar permiso para tocar getlang y alguna otra plantilla importante para que llame a este nuevo módulo en lugar de buscar las plantillas de idiomas. Tmagc (discusión) 05:41 16 ene 2024 (UTC)Responder
De acuerdo, @Tmagc. ¿Te parece bien crear una nueva plantilla y luego reemplazamos los usos de getlang por esta? Peter Bowman (discusión) 10:51 16 ene 2024 (UTC)Responder
@Peter Bowman De acuerdo. Necesito que proceses con tu bot estas páginas. La tabla con todos los códigos es esta. Básicamente es un csv que tiene el formato codigo viejo;codigo nuevo;nombre viejo;nombre nuevo;acción a realizar (cantidad supuesta de páginas que serán afectadas). Las que dicen MIGRAR es porque el idioma es el mismo, pero cambia el código. Las que dicen UNIFICAR es porque se trata de un dialecto de un idioma. En esos casos, lo que quiero hacer además de cambiar el código es insertar la plantilla {{ámbito|}} con el nombre viejo.
Para eso, sugiero algo similar al siguiente algoritmo. No sé si es lo más sofisticado pero es un buen punto de partida para migrar págians en un tiempo razonable. Básicamente esas búsquedas fueron las que hice para detectar páginas con códigos a reemplazar. En este sentido, te pido que empieces procesando la lista de páginas que te pasé porque en esas seguro hay que modificar algo. Vos sabrás qué hacer y cómo hacer con tu bot.
Los códigos que dicen DESTRUIR es porque refieren a idiomas espurios o cuyo nombre es ambiguo o confuso. Prefiero encargarme manualmente de ellos, de todas formas son pocas páginas.
Voy a estar probando la plantilla nueva. Estaré atento, así que avisame cuando hayas terminado así hacemos el cambio de plantilla lo más rápido posible.
PD: hay que ver qué hacemos con la plantilla de {{normalizar nombre}}, también vi que en algunos usos de {{etimología}} no se usan códigos de idioma y se usan nombres en su lugar, como en [algoritmo]. Supongo que habrá que buscar todas estas páginas (gran parte de ellas están en Páginas Requeridas) en donde ocurra esto y hacer los reemplazos correspondientes. Estaré en ello también. Saludos. Tmagc (discusión) 04:10 17 ene 2024 (UTC)Responder
Muchas gracias por la preparación. Me ocuparé en cuanto tenga algún rato libre, espero que ya este fin de semana (o si no de cara al siguiente). Un saludo, Peter Bowman (discusión) 16:30 17 ene 2024 (UTC)Responder
@Peter Bowman Como dije antes, necesito que también te encarges de reemplazar las invocaciones de {{etimología}} con nombres por sus códigos equivalentes. Para eso te paso: un csv, el listado de páginas a revisar, y el algoritmo que deberías ejecutar con tu bot (equivalente en Python). Básicamente la idea es: 1. usar el csv como diccionario para mapear los nombres a sus códigos equivalentes 2. en cada página encontrar las invocaciones mal hechas, 3. ver si el nombre lo tenemos en el diccionario y reemplazarlo por su código de idioma. Por favor, avisá cuando hayas terminado así veo de prohibir invocaciones de la plantilla etimología con nombres de idiomas en lugar de sus códigos.
Es un disparate que se hayan permitido cosas como esas, todo por la paja de no revisar la tabla de códigos o de no querer pedir un código de idioma nuevo. Espero que no vuelva a pasar nunca más. Saludos. Tmagc (discusión) 02:01 22 ene 2024 (UTC)Responder
Una cosa más, los siguientes códigos prefiero tratarlos manualmente porque son más confusos y en generar hay que dividirlos porque refieren a macrolenguas: dog, hmn, kar, mno, mo, prs, roa, simple, smi, syr, xsc, ypk. Las páginas son pocas así que no creo que a nadie le moleste. Tmagc (discusión) 04:17 17 ene 2024 (UTC)Responder
El quechua son varios idiomas, el problema es que casi todo lo que hay aquí lo hizo Marrovi y que los códigos ISO se pasan con las divisiones. Deberían estar el protoquechua, el clásico (IIC?), el quichua ecuatoriano (IIB), el quichua santiagueño (IIC), el quechua sureño (IIC), que es un estándar escrito para todas las variedades bolivianas y las del sur de Perú (ayacuchano, cuzqueño, sudboliviano, etc.), el huanca (I?) y los otros varios quechuas centrales (I), aunque eso es un berenjenal. Casi todo lo que hay en el Wikcionario es quechua sureño. Como extra está la ortografía de cinco vocales (solo hay 3 fonémicas) para el cuzqueño que promueve la Academia Mayor de la Lengua Quechua y tiene bastante uso en la zona.
El quinqui de Ethnologue parece una lengua fantasma. Entiendo que los quinquis son o eran un grupo social que usaba una lengua secreta, de las muchas que había en España, que era una jerga para mantener en secreto las conversaciones. Lo pondría dentro del castellano o el caló según corresponda y con una nota de uso como "Jerga quinqui". Saludos. Lin linao ¿dime? 04:01 9 feb 2024 (UTC)Responder

Do you use Wikidata in Wikimedia sibling projects? Tell us about your experiences

Note: Apologies for cross-posting and sending in English.

Hello, the Wikidata for Wikimedia Projects team at Wikimedia Deutschland would like to hear about your experiences using Wikidata in the sibling projects. If you are interested in sharing your opinion and insights, please consider signing up for an interview with us in this Registration form.
Currently, we are only able to conduct interviews in English.

The front page of the form has more details about what the conversation will be like, including how we would compensate you for your time.

For more information, visit our project issue page where you can also share your experiences in written form, without an interview.
We look forward to speaking with you, Danny Benjafield (WMDE) (talk) 08:53, 5 January 2024 (UTC)

Noticias técnicas: 2024-02

MediaWiki message delivery 01:19 9 ene 2024 (UTC)Responder

Reusing references: Can we look over your shoulder?

Apologies for writing in English.

The Technical Wishes team at Wikimedia Deutschland is planning to make reusing references easier. For our research, we are looking for wiki contributors willing to show us how they are interacting with references.

  • The format will be a 1-hour video call, where you would share your screen. More information here.
  • Interviews can be conducted in English, German or Dutch.
  • Compensation is available.
  • Sessions will be held in January and February.
  • Sign up here if you are interested.
  • Please note that we probably won’t be able to have sessions with everyone who is interested. Our UX researcher will try to create a good balance of wiki contributors, e.g. in terms of wiki experience, tech experience, editing preferences, gender, disability and more. If you’re a fit, she will reach out to you to schedule an appointment.

We’re looking forward to seeing you, Thereza Mengs (WMDE)

Noticias técnicas: 2024-03

MediaWiki message delivery 00:13 16 ene 2024 (UTC)Responder

Modificar las plantillas trad-arriba, trad-centro y trad-abajo, y demás plantillas “colapsables”

Solicito permiso para cambiar las plantillas trad-arriba, trad-centro y trad-abajo. Motivo: con el estilo actual, siempre fuerza a que la tabla comience en una nueva línea en lugar de ajustarse al ancho disponible, por ejemplo cuando hay una imagen. Compárese el estilo anterior de la plantilla rel-arriba con la última modificación que introduje, por ejemplo en poncho. Lo que propongo es dejar el mismo estilo (salvo quizá por el color de fondo) en las plantillas de traducción para que se ajusten automáticamente al ancho disponible y que no quede espacio en blanco.

Por otro lado, la plantilla rel-arriba/centro/abajo ¿es la que debe usarse para hacer cajas desplegables con elementos que no sean traducciones (locuciones, derivados, cognados, etc.)? Tmagc (discusión) 15:36 18 ene 2024 (UTC)Responder

Hola, @Tmagc. Me convence mucho usar mw-collapsible en {{rel-arriba}}, pero abogo por migrar del formato wikitabla ({|...|}) a un div responsivo que haga adaptar el número de columnas (una o dos, como mucho tal vez tres) al ancho del dispositivo empleado (monitor, tablet, móvil). Con esto, {{rel-centro}} y {{trad-centro}} podrán desaparecer. ¿Qué te parece, antes de pasar a {{trad-arriba}}? Además, creo que quedaría algo mejor recudir un poco el padding porque ese cajetín me parece un poco abultado, especialmente en comparación con el actual para las traducciones; es mucho espacio desaprovechado. En lo que se refiere al ajuste al ancho de página, este es el motivo por el que colocamos el dichoso {{clear}} antes del título de sección, así que por fin nos lo podremos cargar :). En cuanto a tu pregunta: creo que sí, ese conjunto de plantillas es un cajón de sastre que se lleva empleando para todo. ¿Tal vez sea momento de estandarizar un poco los nombres? Véase Categoría:Plantillas de columna. Peter Bowman (discusión) 23:07 18 ene 2024 (UTC)Responder
@Peter Bowman Sí, de acuerdo. Para eso puedo analizar el módulo de en.wikt (la vieja confiable) y ver cómo optimiza los elementos (cambia el número de columnas de acuerdo al dispositivo). Entonces trad-arriba, t+ (trad) y trad-abajo llamarían a dos funciones del módulo y dentro de éste se define cómo mostrar los elementos. Cuando lo tenga funcionando aviso así editamos la plantilla.
En cuanto a los nombres, supongo que trad-arriba y trad-abajo se mantienen por ser las más usadas. Después, podemos dejar otra plantilla más con título personalizable o poner un parámetro opcional en trad-arriba y migrar las demás. Aunque supongo que la primera opción (mantener dos plantillas) es la más sencilla por el momento. Tmagc (discusión) 00:02 19 ene 2024 (UTC)Responder
En cuanto a lo que dije del padding, esto es porque uso la skin "Timeless" y en mi caso la invocación de la plantilla tiene este aspecto: [36]. No había comprobado que esto no ocurre en "Monobook", "Vector" ni "Vector 2022" (la actual por defecto). Peter Bowman (discusión) 23:40 23 ene 2024 (UTC)Responder
@Peter Bowman Ya está lista la plantilla. Lo implementé en rel-arriba y rel-abajo. Podés darme permiso para editar trad-arriba, trad-centro y trad-abajo?
Por otro lado, yo creo que lo más fácil es unificar todo a trad-arriba/trad-abajo y dejar un parámetro opcional para cambiar el título por defecto que sería “traducciones”. Tmagc (discusión) 18:56 24 ene 2024 (UTC)Responder
@Tmagc: ¡genial, gracias! He reducido el nivel de protección de {{trad-arriba}}, {{trad-centro}} y {{trad-abajo}}, ya deberías poder editarlas. Lo que propones me parece bien, yo lo vería como un (¿nuevo?) par de metaplantillas arriba-abajo con un título parametrizable, de modo que rel-arriba/abajo y trad-arriba/abajo simplemente la invoquen, reutilizando su código. Esas nuevas plantillas se podrían usar para casos generales, mientras que en las entradas mantendríamos las actuales rel- y trad-. De hecho, tal vez {{arriba}} y {{abajo}} encajen bien para este fin. Peter Bowman (discusión) 22:11 24 ene 2024 (UTC)Responder
Bueno, por el momento está razonable. Lo único que vi es que cuando se llama a {{trad-centro}} genera un nuevo párrafo y por lo tanto se genera un salto de línea en la lista. Pero bueno yo no me preocuparía demasiado, de todas formas hay que hacer un borrado masivo. Tmagc (discusión) 22:44 24 ene 2024 (UTC)Responder
@Tmagc: he configurado mi bot para que, en vez de añadir {{trad-centro}}, {{rel-centro}} y {{clear}}, ahora las borre. A ojo hay unas 70k páginas afectadas, lo he lanzado para que corra sobre todas y aplique los cambios necesarios. Luego veremos qué queda, pues sigue omitiendo aquellas entradas que emplean la antigua estructura y las que presentan homografías con formas flexivas. Además, hay otro caso que olvidaba: también tenemos {{clear}} antes de los títulos "Etimología N" y "Forma flexiva". Peter Bowman (discusión) 23:08 4 feb 2024 (UTC)Responder

Transliteraciones

¿Deberíamos tener títulos con transliteraciones? Yo voto que no, pero no sé si esto ya ha sido discutido. Lo pregunto porque quiero empezar a editar las páginas con plantillas de transliteraciones y entonces:

  • Si no aceptan títulos que sean transliteraciones, hay que moverlos dentro de la plantilla pron-graf en páginas con la grafía original de título. Además, la sección de transliteraciones de dicha plantilla no deberá generar los enlaces.
  • Sino, hay que cambiar las invocaciones de TRANSLIT por lengua|idioma. Aunque igualmente debería aparecer en pron-graf, así que sería algo redundante supongo.

Pero estoy seguro que en algún momento esto se discutió, así que en qué quedaron? Tmagc (discusión) 18:38 18 ene 2024 (UTC)Responder

No ubico ahora el origen de estas secciones, pero puedo indicar que tras el cambio a la nueva estructura abrí este hilo, con una subsección dedicada a ellas: Wikcionario:Café/2015 12#Nueva estructura: plantillas de encabezado. Pretendía entonces lograr una estandarización que al final nunca se materializó, y con el tiempo se fue popularizando una implementación alternativa: {{lengua|<código>|escritura=transliteración}} (tuve que introducir una excepción para el parámetro "escritura" en {{lengua}} para facilitar la categorización de estas entradas).
Convendría releer Wikcionario:Café/2021 04#Plantilla:TRANSLIT y los hilos anteriores allí enlazados. Creo que personalmente nunca me había convencido alojar este tipo de entradas en el proyecto, pero cuando empecé a editar aquí ya estaban bien asentadas. Peter Bowman (discusión) 23:26 18 ene 2024 (UTC)Responder
@Peter Bowman Yo estoy fuertemente en contra de usar plantillas de transliteraciones y esto incluye a los subtítulos que aparecen como parámetros de la plantilla {{lengua}}. Porque esto lleva a tener muchas entradas duplicadas e imprecisas. Las transliteraciones suelen ser muy imprecisas, si son latinas en muchos casos las sacan del inglés y no escriben las tildes donde deberían ir, en otros casos las sacan de otros idiomas y aparecen con marcas diacríticas que no son representativas y no ayudan para nada. ¿Cuál es el argumento del otro lado? Si quieren que los que entran al buscador encuentren la entrada original por medio de la transliteración, para eso está la plantilla pron-graf. Es lo que ocurre ahora mismo al buscar “cherep”, aparece la entrada de череп porque con que esté escrito en algún lado de la página cuáles son las transliteraciones ya alcanza. La transliteración es sólo para ayudar a pronunciar la palabra. De ahí a crear títulos de páginas en un alfabeto diferente al del idioma en cuestión, como si fuera la grafía parte del idioma eso ya está mal.
Otra cosa es hablar de palabras cuya grafía original estaba en otro alfabeto, porque vienen del árabe o del chino y que pasaron a ser nuestras. Hubo una transliteración, pero en ese caso la palabra debe estar bajo {{lengua|es}} y en la sección de etimología explicar el origen.
En suma, las plantillas de transliteraciones y el parámetro transliteración de lengua no sirven y son redundantes. Tmagc (discusión) 00:30 19 ene 2024 (UTC)Responder
Básicamente estoy de acuerdo en todo lo que dices. El borrado de unas mil páginas (Categoría:Transliteraciones) y un cambio de política no es un cambio menor, así que esperemos una semana o dos para permitir que otros expresen su opinión antes de proceder. Por cierto, habrás visto que deshice Especial:Diff/5186427, aprovecho para explicarme: se trata tan solo de evitar que desaparezcan elementos más o menos prominentes de las versiones históricas (es decir, todo lo que figura en el historial de una página excepto su versión más reciente) y en su lugar tengamos un enlace roto. Peter Bowman (discusión) 11:05 19 ene 2024 (UTC)Responder

Vote en el proceso de adopción de la Carta del Comité Coordinador del Código Universal de Conducta

Este mensaje se encuentra disponible en idiomas adicionales en Meta-Wiki. Por favor, ayuda a traducir a tu idioma

Saludos,

Me dirijo a ustedes el día de hoy, con el fin de anunciar que el periodo de votación sobre la Carta del Comité Coordinador del Código Universal de Conducta (U4C) se encuentra abierto. Los miembros de la comunidad podrán emitir su voto y aportar sus comentarios sobre la carta en SecurePoll, desde ahora hasta el 2 de febrero de 2024. Quienes hayan participado anteriormente en el desarrollo de las Directrices de Implementación del Código Universal notarán que el proceso es similar.

La versión actual de la carta del Comité Coordinador del Código Universal de Conducta se encuentra en Meta-wiki, y está disponible en varios idiomas.

Lea la carta, vote, y comparta este mensaje con otros miembros de su comunidad. El Comité Diseñador del U4C espera con ansias su participación.

A nombre del Equipo del Proyecto del Código Universal de Conducta,

RamzyM (WMF) 18:09 19 ene 2024 (UTC)Responder

Rima en̪.te / en.te

Buenas. Hacía mucho que no pasaba por aquí y constato que muchas cosas han cambiado. Por lo que veo, la plantilla { {pron-graf} } se autocompleta ahora automáticamente de un modo total o parcial y acabo de percatarme de que en los adverbios terminados en -mente generan la categoría de rima en.te (aún no creada) en lugar de la ya creada de antes en en̪.te. Considero que la forma fonémica, es decir, en.te es más adecuada que la fonética (en̪.te) pero, sea cual sea aquella por la que opte la comunidad, convendría que fuera unificadas o redirigidas a una sola forma. Saludos. Capitán Adhoc (discusión) 18:46 20 ene 2024 (UTC)Responder

Otra nota más. Me encuentro también con que, en los verbos pronominales terminados en -iarse, { {pron-graf} } genera la rima incorrecta jaɾ.se. Las rimas en español únicamente pueden comenzar con la vocal acentuada, nunca con una semivocal ni con una consonante. Capitán Adhoc (discusión) 19:35 20 ene 2024 (UTC)Responder

@Capitán Adhoc
  1. Gracias por avisar. Igualmente, como ya dije antes: en el caso del español hay que blanquear todas las invocaciones a la plantilla dejar solamente los audios y las ayudas (en el caso de las palabras irregulares).
  2. NEcesito un ejemplo. Lo que decís es que en ensuciarse, la rima debería ser aɾ.se y no jaɾ.se, verdad?
Tmagc (discusión) 01:53 22 ene 2024 (UTC)Responder

Dar de baja etimología2

Hola, quiero que esta plantilla pase a ser considerada obsoleta. En mi opinión no sirve de nada, y etimología cubre perfectamente su función. Por favor, los que todavía usan esta plantilla lean la documentación de la plantilla, que está para ser leída. Van a ver que cubre todas las posibilidades y si falta alguna no cuesta nada agregarla. También pueden avisar en el café o en mi página de discusión para agregar más opciones, que para eso existe la comunicación.

Más aun, hay una serie de plantillas que son duplicados y copias berretas de plantillas que ya existen y que no parecen ir en consonancia con el objetivo de unificar el formato de las páginas. No puede ser que sigamos así. Hay que darlas todas de baja. Ya abriré más adelante otro hilo especificando bien cuáles plantillas hay que marcar como obsoletas. Pero por mientras, dejen de usar esta plantilla.

Las páginas que usan esta plantilla son 40k. Ya pensaré cómo migrarlas. Saludos. Tmagc (discusión) 15:02 22 ene 2024 (UTC)Responder

Hola, hay muchas locuciones que tienen etimologías difíciles acotar de forma rígida (ejemplos: donde Cristo dio las tres voces, en el quinto pino, por el artículo 33, ser más tonto que Abundio...) También hay palabras con varias etimologías posibles como alirón.--Pacostein (discusión) 11:57 24 ene 2024 (UTC)Responder
@Pacostein Estás confundiendo la categorización con la explicación o descripción. Todos los ejemplos que me diste son de una u otra forma categorizables. Para los primeros dos casos, podemos inventar una etiqueta nueva que sea {{etimología|metafórico}} y genera “de origen metafórico”. Eso no prohibe profundizar la explicación a continuación de la plantilla.
La gracia de usar etimología es que permite categorizar. Pero esta otra plantilla sirve sólo para fomentar la vagancia y que aparezcan patrones que fácilmente son llevables a la otra plantilla (ya abrí otro hilo hace poco para agregar el parámetro |endógeno para que entiendas de qu) Tmagc (discusión) 12:38 24 ene 2024 (UTC)Responder

Noticias técnicas: 2024-04

MediaWiki message delivery 01:03 23 ene 2024 (UTC)Responder

Caracteres Han

Buenas. Estuve viendo de migrar al “nuevo” formato las páginas de y la verdad son un enchastre. No obstante, se resuelve rápido creando una plantilla que muestre la información del caracter. Vean por ejemplo el uso de {{mostrar-han}} en .

Hasta ahí todo bien, no son demasiadas páginas para migrar. Lo que necesito saber es si a @Peter Bowman le molesta que la plantilla encapsule la sección entera === Caracter Han === o si, por el contrario, prefiere que la sección y el número de acepción ;1: figuren explícitamente en el cuerpo (edición) de la página. Tmagc (discusión) 19:40 25 ene 2024 (UTC)Responder

Por si no queda claro, a lo que voy es que si hay más páginas similares en donde haya sido introducida la información del caracter manualmente de forma similar a como está ahora, la idea es migrarlas a este nuevo formato y reemplazarlo con esta nueva plantilla. Tmagc (discusión) 19:43 25 ene 2024 (UTC)Responder
@Tmagc: me estoy fijando en en:月#Translingual y, por si en algún momento quisiéramos añadir alguna otra sección de tercer nivel (un "véase también"), me cuadraría más que ese encabezamiento no estuviese encapsulado. Por cierto: si en algún caso hubiera más de una acepción por carácter, ¿añadiríamos otra invocación de {{mostrar-han}}, o el módulo ya se encargaría de listar todas las acepciones? En el caso primero, igual también habría que sacar la acepción fuera de la plantilla, dejando solo la lista. Peter Bowman (discusión) 23:00 25 ene 2024 (UTC)Responder
@Peter Bowman Esta plantilla está pensada para automatizar la información que se muestra en el subtítulo de en:月#Translingual, es decir, lo que se muestra entre paréntesis. Entonces, por lo que entiendo estaría bien con tener una plantilla que genere automáticamente el texto a partir del número de acepción ;1:. Si hay que agregar alguna observación adicional para eso está la plantilla de {{uso}}. En cuanto al {{ámbito}}, la idea es no usar esa plantilla y en cambio ya abrir nuevas secciones para cada idioma en particular. En este sentido, sólo la información técnica debería aparecer en translingüístico. Los significados del caracter es algo que de momento concierne a cada idioma en particular. Así que ahora modifico la plantilla así me decís otra vez qué te parece. Tmagc (discusión) 04:33 26 ene 2024 (UTC)Responder
De acuerdo, creo que queda bien así. ¡Gracias! Peter Bowman (discusión) 15:33 26 ene 2024 (UTC)Responder

Noticias técnicas: 2024-05

MediaWiki message delivery 19:31 29 ene 2024 (UTC)Responder

Últimos días para poder votar en el proceso de adopción de la Carta del Comité Coordinador del Código Universal de Conducta

Este mensaje se encuentra disponible en idiomas adicionales en Meta-Wiki. Por favor, ayuda a traducir a tu idioma

Saludos,

Me dirijo a ustedes el día de hoy, con el fin de recordar que el periodo de votación sobre la carta del Comité Coordinador del Código Universal de Conducta (U4C) concluirá el día Febrero 2. Los miembros de la comunidad podrán emitir su voto y aportar sus comentarios sobre la carta en SecurePoll, desde ahora hasta el Febrero 2. Quienes hayan participado anteriormente en el desarrollo de las Directrices de Implementación del Código Universal notarán que el proceso es similar.

La versión actual de la carta del Comité Coordinador del Código Universal de Conducta se encuentra en Meta-wiki, y está disponible en varios idiomas.

Lea la carta, vote, y comparta este mensaje con otros miembros de su comunidad. El Comité Diseñador del U4C espera con ansias su participación.

Atentamente,

RamzyM (WMF) 17:01 31 ene 2024 (UTC)Responder

Solicitud de flag de bot

Solicito el flag de bot para Usuario:TMCbot. El motivo es sencillo: debido a la gran cantidad de cambios implementados recientemente y a la gran discrepancia entre formatos que últimamente se ha hecho más evidente, es necesario realizar cambios en algunas páginas. Más precisamente me centraré primeramente en dos cosas:

  1. Limpiar las plantillas pron-graf que aún tienen las transcripciones manuales, con el debido cuidado de no perder información. PAra que se den una idea, el algoritmo con el que voy a empezar es este, que limpia las plantillas con el parámetro altpron, dejando los parámetros h, g, v, e, p, y todas sus variantes. Las plantillas con audios serán analizadas manualmente para asegurar que concuerden con las transcripciones.
  2. Migrar los códigos de idiomas viejos y las invocaciones de {{etimología}} con idiomas en vez de códigos. Como ya lo mostré antes, un borrador para el algoritmo de lo primero es [45] (mejor si supiera todas las plantilas que usan plantillas de códigos de idioma), y el algoritmo para lo segundo es [46].

Por el momento, el bot no se va a ejecutar periódicamente, lo voy a activar manualmente con PAWS para procesar los lotes de páginas que quiera. Hay otras tareas del mismo tipo que también me interesan, como fusionar patrones comunes de etimología2 en etimología todo lo que sea posible, migrar las invocaciones de cita libro, cita noticia, cita web, etc. en referencia, y unificar plantillas las plantillas de contenedores eliminar plantillas de contenedores viejos como rel4. Me encargaré en cuanto termine con las primeras dos. Tmagc (discusión) 13:48 3 feb 2024 (UTC)Responder

  A favor. Peter Bowman (discusión) 16:21 3 feb 2024 (UTC)Responder
@Peter Bowman Cómo son los plazos para estas cosas? Creo que ya pasó un tiempo prudencial para que alguien se opusiera... Tmagc (discusión) 17:26 10 feb 2024 (UTC)Responder
@Tmagc: si no hay más indicaciones al respecto, en los proyectos de WMF se asume una semana como mínimo, que justamente se ha cumplido hoy. En un momento te asigno el flag. Recuerda configurar un throttle para evitar saturar los servidores; se aconseja una edición cada 5 segundos (aunque en tiradas muy cortas yo lo he llegado a rebajar a uno o dos). Tómate tu tiempo y haz las pruebas que necesites antes de procesar grandes lotes de entradas. Cuando vayas a ejecutar tareas nuevas, abre un hilo aquí y espera un tiempo prudente para permitir posibles observaciones. Ten presente, por favor, Usuario discusión:Tmagc#צבוע: aunque solo sean un porcentaje del total, hay muchas entradas que tiran del parámetro "alt" para los fines allí descritos, de modo que aún no podemos prescindir de él totalmente. Peter Bowman (discusión) 18:57 10 feb 2024 (UTC)Responder

Tech News: 2024-06

MediaWiki message delivery 19:22 5 feb 2024 (UTC)Responder

Plantilla: ejemplo

En mi opinión los ejemplos deberian aparecer colapsados, en algunas entradas sobrecargan de información que no siempre se requiere Cvmontuy (mensajes) 11:30 6 feb 2024 (UTC)Responder

@Cvmontuy Desde que convertí la implementación a Lua, no pude agregar los :: dos puntos sin que el módulo me los escape en lugar de procesarlos como texto wiki. Por eso es que ya no se muestran más colapsados. En unos días lo reviso, pero no uses otras plantillas porque sino vamos a tener discrepancias entre formatos de páginas. La plantilla es {{ejemplo}}. Te recomiendo estar al tanto de Categoría:Plantillas obsoletas. Tmagc (discusión) 13:55 6 feb 2024 (UTC)Responder
@Cvmontuy, @Tmagc: corregido en Especial:Diff/5213181. Un saludo, Peter Bowman (discusión) 16:17 6 feb 2024 (UTC)Responder
Gracias, en la plantilla obsoleta ejemplo y trad se tienen las referencias tanto al texto como a su traducción, hay textos que tienen varias traducciónes y asi se cumple con condición de citar la fuente Cvmontuy (mensajes) 19:50 6 feb 2024 (UTC)Responder
@Cvmontuy Eso está difícil, porque hay parámetros que ya son lista. En esta nueva plantilla, por ejemplo si hay varios autores la idea es especificarlos uno por uno, |a1, |a2, y así hay otros parámetros que también se pasan como una lista. Una solución que se me ocurre para esos casos que decís sería duplicar todos los parámetros con el prefijo |trad (o el prefijo que más te guste), entonces quedaría por ejemplo |trada1, |trada2 y así para todos los parámetros. Te parece razonable? Tmagc (discusión) 21:07 6 feb 2024 (UTC)Responder
Si me parece razonable, muchas gracias Cvmontuy (mensajes) 21:10 6 feb 2024 (UTC)Responder

Etimología del apellido Vélez

La filología descriptiva actual señala como étimo del apellido Vélez el nombre godo de persona (quizá también patronímico) "(W)Vigila". De aquí derivan el nombre español-medieval "Vela", el apellido "Vélez", el nombre-apellido "Velasco" y otras variantes como "Velázquez" etc. 212.231.115.239 (discusión) 10:18 7 feb 2024 (UTC)Responder

IMPORTANTE: Revisión de actividad de administradores

Hola. En virtud de un consenso comunitario global, se aprobó en el año 2013 una política que tiene por objeto la retirada de los permisos avanzados (administrador, burócrata, administrador de interfaz, etc.) de aquellas cuentas que se encuentren inactivas. De acuerdo con la misma, los stewards están revisando la actividad de los administradores en todos los proyectos de la Fundación Wikimedia que no dispongan de una política de inactividad propia. Hasta donde sabemos, este wiki no cuenta con un proceso formal ni política relativa a la revisión y retirada de permisos avanzados de cuentas inactivas. Esto significa que los stewards se encargarán de ello de acuerdo con la política de revisión de actividad administrativa.

Hemos determinado que los siguientes usuarios cumplen el criterio de inactividad (sin ediciones ni acciones registradas por más de 2 años consecutivos):

  1. Hprmedina (burócrata, administrador, administrador de interfaz)

Estos usuarios recibirán una notificación pronto, donde se les informará que deben empezar una discusión en la comunidad si quieren mantener algunos o todos sus permisos. Si los usuarios no responden sus permisos serán retirados por los stewards.

Sin embargo, si ustedes como comunidad desean crear su propio proceso de revisión de actividad para sustituir el proceso global, quieren tomar otra decisión acerca de los usuarios inactivos o tienen alguna otra política que se nos pasó por alto, entonces notifiquen a los stewards en Meta-Wiki para que sepamos que no debemos proceder con la revisión de permisos en este wiki.

Gracias, Superpes15 (discusión) 17:11 7 feb 2024 (UTC)Responder