Noticias técnicas: 2023-45 editar

MediaWiki message delivery 21:05 6 nov 2023 (UTC)

Formas pronominales editar

Buenos días. Veo que en la lista de páginas requeridas hay muchos verbos pronominales cuyas páginas asociadas de los verbos raíz ya existen. Considero que agregar las entradas para los mismos es algo muy fácil de automatizar. Simplemente habría que indicar el verbo raíz asociado (al estilo "Forma pronominal de ...") y agregar la tabla de conjugaciones correctas para cada verbo. No me parece que valga la pena agregar una definición per se, porque la mayoría de los verbos son poco frecuentes y con el enlace al verbo raíz se entiende perfectamente el significado. ¿Podrían comentar si están de acuerdo? ¿Hay otras cosas como éstas que podrían ser automatizadas? Tmagc (discusión) 13:18 31 oct 2023 (UTC)

Hola. Sí, millones de cosas pueden automatizarse, nos faltan personas que lo hagan y que quede bien, así que la ayuda es bienvenida. Sí, se pueden crear esos verbos pronominales, pero hay que tener cuidado con pasarse de automatizadores. Por ejemplo, no me parecería bien que olvidarse se defina como "Forma pronominal de olvidar". Si quieres hacerlo de forma masiva, tienes que pedir permiso para correr un bot. Se hace aquí con un encabezado como "Solicitud de flag de bot para (cuenta)" y supongo que deberías enlazar el código y explicar el alcance: creación de páginas, con o sin supervisión, cambios en otras páginas, etc. Saludos. Lin linao ¿dime? 14:42 31 oct 2023 (UTC)
Hola, @Tmagc. La lista Especial:PáginasRequeridas reúne todas aquellas páginas aún sin crear enlazadas desde cualquier otra página del proyecto. Esto es, si en esta misma página del Café añado el enlace [[asdfghj]], en dicha página aprecería asdfghj; en este caso no la veremos porque las entradas van ordenadas de mayor a menor según el número de enlaces que dirijan a ellas. Has creado un número potencialmente grande de verbos pronominales que ni siquiera existen; en tu página de discusión te he mostrado tres escogidos al azar. Si han aparecido en la lista es porque Módulo:forma verbo/pronominales construye la forma pronominal, comprueba que esa página existe y, en caso afirmativo, genera un enlace interno. Esto tiene como efecto secundario hacer que dicho verbo fantasma sea reconocido por Especial:LoQueEnlazaAquí y la lista en cuestión.
Acabo de dejar una nota de aviso en MediaWiki:Wantedpages-summary. Por precaución (y porque no veo una forma rápida de filtrar los verbos que sí se deberían quedar), borraré todas las entradas que has creado. Si surge la necesidad de automatizar un proceso, por favor, usad un bot activo (yo puedo aportar el mío). Un saludo, Peter Bowman (discusión) 15:46 31 oct 2023 (UTC)
Hecho, he borrado casi cuatro mil entradas. Un saludo, Peter Bowman (discusión) 23:01 31 oct 2023 (UTC)
Buenas, reconsideré lo que comentaste. Comento mientras lo que estoy pensando hacer. En primer lugar, clasifiqué los casi 5000 verbos que aparecen en la sección de "páginas requeridas". Curiosamente son menos de cien las formas pronominales registradas en los diccionarios. Me basé en dos diccionarios: el DLE y el de Larousse, con 50 y 46 verbos pronominales reconocidos respectivamente. Como varias no aparecen en el DLE pero sé que existen, estaría bueno tener otras fuentes que las acrediten. En cuanto a esto, todavía me gustaría ver si hay otros diccionarios que reconozcan algún otro verbo.
Lo que estoy haciendo es clasificar los demás verbos: los que sabemos que no existen o no los vamos a encontrar en ningún lado, y por otra parte los que existen pero no tenemos suficiente respaldo para agregarlos. Por ahora me basé en revisar si aparecen en Google Ngrams, pero hay algunos que no aparecen y sin embargo sé que existen porque los escucho bastante (por ejemplo: "bardearse").
Entonces, lo que quiero hacer es: primero, para los verbos registrados en algún diccionario, agregar la entrada (al estilo forma pronominal de ...) con la cita al diccionario en el que aparezcan. Los que aparecieron en Ngrams o en algún buscador de palabras más "masivo" pero no en los diccionarios, los "dejaría en suspenso". Y para los que sabemos que no existen, en principio habría que sacar los links a esos verbos para que nadie piense que falta esa entrada.
Además de preguntar qué te (les) parece todo esto, quisiera saber: ¿no hay forma de quitar los enlaces? Lo pregunto porque creo que no terminé de entender cómo es que se produjeron esos enlaces. Tomemos como ejemplo Especial:LoQueEnlazaAquí/ciarse. Supuestamente hay 59 páginas enlazadas a este verbo pero en ninguna de ellas aparece el enlace a ciarse. ¿Por qué es que aparece este enlace en la lista de páginas requeridas con 59 páginas? ¿No hay forma de solucionar este inconveniente para que aparezcan en la sección de "páginas requeridas" palabras que realmente sean de interés para añadirlas? Tmagc (discusión) 19:45 2 nov 2023 (UTC)
Hola, @Tmagc. Esos enlaces son un efecto colateral de emplear cierta función Lua dentro de Módulo:forma verbo/pronominales (este, a su vez, siendo invocado desde {{forma verbo}}). En entradas de formas no canónicas como comí, comerá, comiendo, etc., si se ha usado esta plantilla, sus mecanismos internos comprueban que existe la entrada comerse y, en caso afirmativo, hacen que la definición acabe en "de comer o de comerse", en lugar de solo "de comer". La mera comprobación de la existencia del verbo pronominal hace que MediaWiki lo registre en la lista de páginas enlazadas y, por consiguiente, que figure en nuestra lista de páginas "requeridas". Este mecanismo pretende evitar que sea necesario añadir masivamente el parámetro |pronominal=x| a {{forma verbo}}. La única forma de sortear el obstáculo de los enlaces es hacer precisamente eso, o directamente retirar el módulo Lua. Peter Bowman (discusión) 22:35 2 nov 2023 (UTC)
Buenas @Peter Bowman. Te comento dos cosas:
1. Ya tengo los verbos pronominales que sí existen. Son alrededor de 200, pero me basé en cuatro diccionarios diferentes porque difícilmente cada verbo aparezca en más de un diccionario. Lo que voy a hacer es agregar de cada sitio aprox. 50 verbos pronominales (50*4 ≅ 200) con el formato que comenté y la cita al sitio en el que aparece. ¿Vale la pena que solicite un bot para hacerlo?
2. Hay ciertos verbos que voy a añadirlos manualmente porque el significado es diferente al de la forma no pronominal. Curiosamente, fusilarse es uno de ellos, o también degollarse o nortearse (este último no tiene forma no pronominal). En cuanto a esto, estaba pensando que me gustaría que sea deshabilitado el módulo que me comentabas (Módulo:forma verbo/pronominales), o bien, reescribir el código en donde haga falta para que no haga la comprobación sobre si existe la página pronominal. Siguiendo el ejemplo que comentabas, quisiera que quede "de comer" en lugar de "de comer o de comerse". Además de que como está ahora produce el problema de que en Páginas Requeridas se generan enlaces a verbos que no existen, no pienso que a cambio sea algo que agregue demasiado valor. No creo que este sitio esté hecho específicamente para buscar los infinitivos pronominales a partir de una conjugación; teniendo ya el infinitivo, el pronominal es fácil de inferir. Por lo general la búsqueda inversa (obtener las conjugaciones sabiendo el infinitivo) es bastante más usual. Además, el se no deja de ser un pronombre más. De no ser así, ¿por qué no agregan también "de comerlo, o de comerla"? Como sea, podría seguir encontrando defectos a esa función. Lo que quisiera saber es cómo funcionan "los protocolos" para eso: si se cambia el módulo y ya, o si hay que convocar a una votación por algún medio. Tmagc (discusión) 15:44 4 nov 2023 (UTC)
Nota menor: nortear es un verbo con varias acepciones, sale en el DLE actual. Si existe acuerdo de que hay que cambiar o desactivar el módulo, no creo que haga falta votar, pero supongo que no existe ese acuerdo y que antes habría que pensar en los pros y contras de cada opción. Saludos. Lin linao ¿dime? 19:43 10 nov 2023 (UTC)
Hola, @Tmagc y @Lin linao. Lo he estado pensando un poco y creo que sí, esta solución se siente como un hack que no aporta mucho. Los pros acaban en aportar un enlace directo a la forma pronominal. Los contras son sobrecargar las entradas (un poco) con un módulo adicional y volver inservible la página especial de la que estábamos hablando. Introduje este mecanismo en 2014 sin pasar por el Café siquiera, fue una propuesta que le hice a un administrador (Edgefield) y que pareció cuajar: Usuario discusión:Edgefield/Archivo2014#formas verbales de zurrar, Usuario discusión:Peter Bowman/Archivo 1#RE:zurrarse y pronominales. Por mí lo retiramos. ¿Hay alguien en contra? Peter Bowman (discusión) 19:34 12 nov 2023 (UTC)
He desactivado esa comprobación en {{forma verbo}} (Especial:Diff/5170363) y {{participio}} (Especial:Diff/5170360). Llevará un tiempo refrescar la caché y las páginas especiales. Peter Bowman (discusión) 17:54 18 nov 2023 (UTC)
Lo mismo en {{forma participio}} (Especial:Diff/5170436). Peter Bowman (discusión) 00:07 19 nov 2023 (UTC)
Y también en {{gerundio}} (Especial:Diff/5170438). Peter Bowman (discusión) 00:15 19 nov 2023 (UTC)
@Tmagc, @Lin linao: ya está, ninguna entrada transcluye este módulo. Peter Bowman (discusión) 00:20 19 nov 2023 (UTC)
Muchas gracias, Peter Bowman. Creo que es la decisión correcta. Saludos. Lin linao ¿dime? 00:33 19 nov 2023 (UTC)
Gracias por haberlo hecho. Esto evitará confusiones futuras y, si estoy en lo correcto, permitirá la utilización de la sección de páginas requeridas de forma más virtuosa. Saludos, Tmagc (discusión) 02:18 19 nov 2023 (UTC)

Noticias técnicas: 2023-46 editar

MediaWiki message delivery 23:52 13 nov 2023 (UTC)

Sobre la unificación del formato editar

Muy buenas de nuevo. Estoy viendo que presentan algunas inconsistencias con el formato de maquetado entre diferentes páginas; los formatos en los que se presentan las entradas no concuerdan y parecería deberse a diferencias en las plantillas respecto de versiones viejas. Estaba pensando si se podría ejecutar un bot en las páginas que sea necesario para:

- cambiar todas las plantillas {{ES}} por {{idioma|es}}, y hacer lo mismo con las demás. Por ejemplo {{LA-ES}} quede {{idioma|la}}

- cambiar {{pronunciación}} por {{pron-graf}}

- poner el texto que esté como subtítulo de alguna etiqueta en la definición como parte de la plantilla que corresponda si es que existe. Por ejemplo, si en una definición aparece algo como '''uso''': coloquial cambiarlo a {{uso|coloquial}}. Creo que esto también aplicaría a la sección de etimología, vi que en muchas páginas viejas no se usa la plantilla que existe y en lugar optan por escribirla "suelta"

- en caso de que la página presente secciones con formato viejo y secciones con formato nuevo, en principio no pienso hacer cambios automáticos. Preferiría hacerlo manualmente por las dudas.

Quería conocer sus opiniones, y, si es están de acuerdo, saber qué otras cosas respecto a esto se podrían hacer. Por mi parte aún necesito tiempo para pensar y probar bien cómo quedaría el código, pero por mientras pueden opinar. Tmagc (discusión) 02:12 13 nov 2023 (UTC)

Hola, @Tmagc. Lo correcto es cambiar {{ES}} por {{lengua|es}} y {{LA-ES}} por {{lengua|la}}. Ya hice esa migración en 2015, afectó a cerca de un millón de páginas; quedaron unos pocos miles (a día de hoy, entre dos y tres mil) que presentan una estructuración más complicada la cual preferí no automatizar (aún). Aun así, con el tiempo he ido introduciendo otras mejoras en el programa de mi bot como la sustitución de las plantillas de uso que comentas, luego convendría que lo corriese nuevamente sobre todas las páginas de Wikcionario para normalizar su formato. Sea como fuere, cada día ejecuta una serie de rutinas sobre los cambios recientes de las últimas 24 horas; están descritas en Usuario:PBbot. En resumen: el código ya está hecho y acepto sugerencias para mejorarlo, si el bot se salta alguna página es porque (en principio) debería revisarla un humano. Un saludo, Peter Bowman (discusión) 10:13 13 nov 2023 (UTC)
Pienso que sobre este tema aún queda bastante por hacer. Buscando patrones que caen bajo mi criterio de “obsoleto” o “debería ser reemplazado por la plantilla existente”, conté casi 20 mil páginas. Aunque es cierto, la estructura no es tan simple para automatizar reemplazos como parecería. Pero (quizá de terco que soy) voy a estar intentando hacer un código que sea lo suficientemente sofisticado para poder hacer más reemplazos. Voy a arrancar por los “Caracteres orientales”, que son pocos y serviría para probar. Tmagc (discusión) 04:06 24 nov 2023 (UTC)

Agregar páginas para caracteres reservados <, >, etc. editar

Buenos días. Hoy se me ocurrió crear páginas para definir los símbolos aritméticos < menor y > mayor. Parece ser que no puedo crearlas porque son caracteres reservados. Me gustaría resolver esto, viendo que el Wiktionary en inglés lo resolvió creando una categoría nueva Unsupported titles. De este modo, al introducir < en el buscador, se redirecciona a Unsupported titles/`lt`. Crear una categoría nueva no parece difícil. Pero redireccionar las búsquedas a otros títulos, eso no sé cómo está implementado. Por este motivo espero a escuchar sus opiniones, si saben bien cómo lo hacen o si se les ocurre otra posible implementación. Saludos, Tmagc (discusión) 14:47 18 nov 2023 (UTC)

Agrego que también estaría bueno agregar un generador de información automática para los caracters unicode. Estoy viendo que en el Wiktionary tienen esta automatización implementada, de modo tal que basta escribir {{character info}} para que genere automáticamente la tabla con la información del nombre unicode, el código, el caracter anterior y el siguiente, etc. No tiene sentido que en nuestra plantilla {{unicode}} sea obligatorio poner toda la información a mano cuando es información que ya existe. En el sitio en inglés tienen muchas cosas automatizadas mediante módulos, y como no veo cuál es el problema de ‘pedirlos prestado’ y adaptarlos a nuestro sitio para usarlos también. Voy a estar intentando hacer pruebas con eso, para quizá en un futuro cambiar nuestra plantilla. Tmagc (discusión) 03:57 24 nov 2023 (UTC)

Noticias técnicas: 2023-47 editar

MediaWiki message delivery 00:55 21 nov 2023 (UTC)

Algunas (otras) cosas sobre el formato, la apariencia y la edición editar

Ya abrí otros hilos de conversación sobre asuntos más “técnicos”, ahora quería escribir cosas que conciernen más a la apariencia de las páginas y al uso del editor que quisiera que se cambien:

En primer lugar, me resulta extraña la jerarquía de los títulos. Se supone que en un primer nivel está el idioma, en un segundo nivel las etimologías, en un tercer nivel la clasificación de palabra y en un cuarto nivel ya vienen todas las acepciones. En general, todo lo que aparece bajo una misma etimología está muy relacionado y por esto el criterio es que estén en un nivel anterior a las clasifiaciones. Si bien apuesto a que el resto comparte el criterio, visualmente es raro que los subtítulos de etimologías aparezcan al mismo nivel que los de las clasificaciones. Creo que el problema está en la plantilla de ayuda que viene por defecto con el editor, que pone en === nivel 3 a la etimología y también, por ejemplo, a {{sustantivo|es}}. ¿Nadie se dio cuenta de esto? ¿Por qué no cambiar el formato para que las clasificaciones aparezcan visualmente subordinadas a las etimologías, sabiendo que así es como se suelen estructurar las páginas para las palabras?

Por otra parte, algo que tampoco entiendo es por qué en cada ;#: acepción, se agrega un salto de línea en lugar de que la definición aparezca escrita inmediatemente a continuación del número. ¿No les parece que queda demasiado espacio en blanco? Comparen con los demás wikcionarios y con páginas de diccionarios de otros sitios.

Finalmente, en muchas, muchas páginas hay .. dobles puntos. Creo que el germen del problema es evidente: algunas plantillas agregan el punto, como {{w}}, mientras que otras no lo agregan, como {{etimología}}. En primer lugar, habría que hacer una comprobación masiva con un bot, que incluya a páginas viejas, para arreglar esto. Antes de hacerlo, ¿no conviene que acordemos en pactar una convención para que todas las plantillas incluyan o no incluyan el punto, y ya? Puede parecer que estoy pidiendo mucho, pero igual quería preguntar esto último, porque a mí me confunde que algunas plantillas agreguen el punto y otras no. Y como veo muchas páginas con el doble punto, supongo que no soy el único al que le pasa. Pero si ya todos se acostumbraron y se saben de memoria cuáles son las plantillas que agregan el punto, que no se cambie nada. Tmagc (discusión) 04:34 24 nov 2023 (UTC)

Partamos por el final. Creo que tienes razón, eso del punto/no punto es algo que hay que resolver. Yo optaría por el sí punto, ya que casi siempre la plantilla se usa como viene y no hay más que hacer. Lo de la jerarquía de los títulos viene de que tomamos un acuerdo que no consideró los casos de más de una etimología, me parece. No sé cuál es la mejor opción para arreglarlo, pero creo que está mal lo actual. Saludos. Lin linao ¿dime? 05:21 24 nov 2023 (UTC)
Hola, Tmagc. Desglosando:
  • Normalmente la sección de etimología y las subsiguientes comparten nivel (===), pero si en una misma entrada tenemos más secciones de etimología o alguna forma flexiva, las acepciones bajan al nivel cuarto (====). Esto está recogido en WN:ES#Estructuración especial y fue discutido en Wikcionario discusión:Estructura. Yo hoy me decantaría por unificar y separar por niveles como indicas, sin excepciones.
  • En cuanto al salto de línea en las definiciones, posiblemente fuese para dar cabida a las marcas de campo semántico, p. ej. Zoología en la entrada "gato". De todos modos, también se podría con elementos de lista (#), aunque sería necesario modificar todo lo que viene debajo de las acepciones (p. ej. la implementación de {{sinónimo}}).
  • Los puntos sobrantes son, me parece, resultado de un descuido: le añadimos uno a la plantilla porque resulta que en la página X no había punto, y no corregimos las otras 1000 páginas que también transcluyen esa plantilla y ya venían con un punto, dando lugar a la repetición que comentas. Hay que ser cautos: ciertas plantillas prácticamente siempre van a llevar punto, ya sea implícito o explícito (como {{w}}), y otras se emplean muchas veces como parte de una oración y no pueden llevar punto siempre (como {{etimología}}).
Un saludo, Peter Bowman (discusión) 22:41 24 nov 2023 (UTC)
Insisto nuevamente y para ver si es posible avanzar en algo:
1. En principio habría acuerdo en dejar en segundo nivel sólo los idiomas, sólo las etimologías en tercer nivel y todos los demás subtítulos en el cuarto nivel, es decir, quedarían suboordinados a las etimologías. Otra opción es dejar el "Véase también" y las "traducciones" en tercer nivel, pero creo que es más coherente que vayan al cuarto nivel. Quedaría el quinto nivel que quizá podría usarse en el caso de las formas flexivas y todo eso.
2. Otra opción es usar :1. . También :[1] , como está en el Wikcionario en alemán. Es decir, usar los dos puntos en lugar del punto y coma. Queda una sangría respecto del subtítulo que es algo menor que los items de aclaración que vienen tras las acepciones. Para mí es la que va, sólo que habría que editar el formato de las plantillas de campo (zoología, física, etc.).
3. Es cierto. No es posible que todas lleven o no lleven punto. Pero igualmente considero puntualmente que el caso de etimología es confuso, ya que yo la suelo usar para indicar el idioma y la palabra de origen sin hacer ninguna aclaración adicional. Cuando necesito hacer más aclaraciones, prefiero etimología2, entonces considero que la primera podría llevar punto. Aún me quedan dudas.
4. Otro tema que pensé es sobre las tablas de flexión de sustantivo y adjetivo (masculino/femenino/singular/plural). ¿No sería más razonable alinearlas a la derecha, debajo (o encima) de la pronunciación pron-graf? Como está ahora pienso que no queda tan bien, se desperdicia mucho espacio.
Un bosquejo lo dejé en Wikcionario:Zona de pruebas/2. Si miran en la segunda etimología, la tabla a la derecha desperdicia espacio pero sólo es por la imagen. Sin embargo, estos casos son los menores y en todo caso se podría alinear a la deracha por defecto e incluir en la plantilla una opción para aclarar que se desea alinear la tabla a la izquierda. Tmagc (discusión) 05:51 25 nov 2023 (UTC)
Sin prisa, de momento solo hemos opinado tres y acabamos de empezar a arañar la superficie. Las secciones "Forma flexiva" por consistencia tienen el mismo nivel que "Etimología X". Las traducciones acompañan a cada sección de etimología, luego pertenecen al nivel cuarto. La opción de escribir :1. en vez de ;1: me parece un pelín menos legible que antes. Comprendo el argumento del desaprovechamiento del espacio, pero no me quedan claros los beneficios de prescindir tanto de él. {{etimología}} siempre es preferible a {{etimología2}}; la segunda no categoriza ni permite estandarizar el formato. La plantilla {{pron-graf}} no me convence, al principio iba a formar parte de una sección separada llamada "Pronunciación y escritura" (está en los archivos, puedes ver cómo quedaba). Si nos la cargásemos, se podría aprovechar mejor ese margen derecho para las tablas de flexión, que de hecho algunas ya funcionan así. Nota importante: toda mejora en el formato se debe contrastar con la versión móvil de Wikcionario, cada día más popular. El enlace permanente para tu edición en la zona de pruebas es Especial:PermaLink/5172076. Peter Bowman (discusión) 17:15 25 nov 2023 (UTC)

Noticias técnicas: 2023-48 editar

MediaWiki message delivery 23:08 27 nov 2023 (UTC)