Localization/lang-es
La tecnología de internacionalización se refiere a la representación y composición de los lenguajes hablados, enseñados y usados en los diferentes países. Localización es el proceso de tomar el software o contenido y adaptarlo a su uso local.
La localización involucra tipografía, diagramación de texto, metodos de entrada, síntesis de habla, intrumentación musical, secuencia de ordenamiento, formatos de fechas y números, diccionarios y correctores ortográficos, entre otros temas.
Linux se encuentra más localizado que MS-Windows ya que no necesita la cooperación del vendedor para ello; dicho esto, la cooperación en la comunidad de software libre y de contenidos es vital para reducir la cantidad de trabajo requerido.
El problema es enorme. Ethnologue tiene una vasta cantidad de informacion sobre los idiomas en el mundo.
- Ver también la definición de Wikipedia (en inglés).
A continuación una breve guía de (algunos) de los temas centrales y herramients para la localización.
(Si necesita localizar los símbolos del teclado de la laptop distribuida durante la fase de desarrolladores de nuestro programa, por favor vea las instrucciones que se encuentran en Customizing NAND images/lang-es#Keyboard en este wiki.)
Temas Básicos de Localización
Juegos de Caracteres
Unicode se encuentra totalmente soportado por las aplicaciones y herramientas "modernas" usadas en el software libre. Conjuntos o juegos de caracteres en desuso también son soportados, pero las aplicaciones modernas usan Unicode.
La secuencia de ordenamiento (collating) del texto se encuentra generalmente bien soportada en las bibliotecas de C.
- Ver también: Category:Fonts, Unicode.
Diagramación de Texto
La OLPC usa principalmente la biblioteca Pango, capaz de diagramar la mayoría de los idiomas "difíciles", incluyendo: Arábigo, idiomas Hindúes, Hebreo, Persa, Tailandés, etc. Posee un motor de diagramacíon componentizado (pluggable) y soporta tanto el texto vertical así como también la diagramación bi-direccional. En general, a pesar de algunos temas, Pango puede manejar la mayoría de los tipos de escrituras; de no ser así se pueden construir módulos específicos, como se especifica en el manual de referencia de Pango (en inglés)
- Ver también: Category:Languages (international)
Tipografía
Con el fin de divulgar contenido y preservar la herencia cultural, la OLPC tiene como meta abarcar todos los idiomas del mundo. Al usar el sistema Fontconfig de Linux nos encontramos en una mejor posición para cubrir más escrituras que otros sistemas. «Fontconfig» es usado para configurar el sistema tipográfico y determinar qué conjunto de tipografías son necesarias para abarcar un conjunto dado de idiomas.
El formato de las tipografías soportado en Linux incluye OpenType, TrueType y otros: ver Freetype para más detalles. La mayoría de los formatos de tipografías soportadas por Freetype son obsoletas, y el mejor resultado en pantalla se logrará usando tipografías OpenType y TrueType, particularmente si han sido apropiadamente insinuadas. Las tipografías Type 1 son útiles para imprimir; el diagramador de tipografías Type 1 en Freetype no es muy bueno, y Type 1 no soporta indicaciones programáticas para pantallas de baja resolución.
La XO-1 de la OLPC tiene una alta resolución de pantalla. Una alta resolución nos ayuda enormemente, en particular en la escala de grises a 200PPP. La Wikipedia (en) es un buen punto inicial para las tipografías libres. «Font Foundries» son empresas especializadas en producir tipografías.
- Ver también: Category:Fonts, Fonts, HIG-Texto y Tipografía
Tipografía Libre
Existe tipografía libre para la mayoría de las escrituras mundiales, aunque algunas tienen un licenciamiento inapropiado para su libre re-distribución.
Necesidad de Tipografías de Pantalla
Nuestras aplicaciones y contenidos deberían ser utilizables en cualquier otra pantalla, no solamente en nuestra pantalla de alta resolución. Con lo cual la comunidad OLPC debe trabajar en expandir la cobertura de tipografías de pantalla de alta calidad. La familia tipográfica "DejaVu" (derivada de Bitstream Vera) cubre la mayoría del alfabetos latinos y algunos otros idiomas. Esta familia tiene en general una buena 'insinuación' (hinting) para su uso en pantalla. El lanzamiento reciente de la familia «Liberation» de Red Hat es una ayuda al momento de reemplazar las familias tipográficas de Microsoft, pero aún carece de una gran cobertura.
SIL International también produce tipografías para una serie de idiomas adicionales de interés local.
Ayudar con éstos u otros esfuerzos de desarrollo de tipografías o aumentar la cobertura de tipografías existentes es muy valioso. El aunar esfuerzos en glifos insinuados (hinting glyphs), importante aunque tedioso, y/o la donación o compras también están siendo exploradas.
Teclados
La diagramacion de teclados actual muestra los teclados actualmente disponibles: el incluir nuevas diagramaciones es un trabajo relativamente menor si existen diagramas para dichos idiomas. Gente con experiencia local deberá trabajar con la OLPC para generar nuevas diagramaciones.
- Ver también: Category:Keyboard, HIG-Sistemas de Entrada-Teclados
Métodos de Ingreso
Un método de entrada, es software que permite la escritura (entrada/tipeo) de caracteres complejos o con más símbolos que teclas, por ejemplo lenguajes como el Chino, Japonés y Coreano.
Sistemas de software libre usan actualmente SCIM - Smart Common Input Method Platform. SCIM remplaza a métodos de ingreso más viejos.
Sabiendo qué idiomas son enseñados como "segundos" idiomas, así como también el/los nativos en una dada área, con el fin de diseñar teclados que sean lo más útiles para cada país. Por ejemplo, el teclado Nigeriano fue diseñado para permitir tanto el Inglés, Hausa y Youba, que son idiomas comunes en buena parte de Nigeria. El "EE.UU./Internacional" cubre la mayoría de los idiomas Europeos.
Todavía quedan pendientes algunos puntos en nuestra tecnología de base. Por ejemplo, las ligaduras en arábigo pueden presentar problemas: al evitar ponerlas en el teclado evitamos la necesidad de un método de entrada. Sin embargo, estas soluciones pueden no ser realizables en su idioma.
- Ver también: Input methods, HIG-Sistemas de Entrada
Accesibilidad y Usabilidad
Síntesis de habla
El sintetizado de voz involucra una serie de concesiones complejas balanceando el tamaño del sintetizador versus la fidelidad versus el esfuerzo de incluir un nuevo idioma. El artículo de Wikipedia sobre la síntesis de habla o voz menciona software actualmente disponible, que incluyen a festival, flite y espeak.
Espeak es lo suficientemente pequeño para ser empaquetado por nosotros y cubre unos cuantos idiomas: ~10 idiomas actualmente siendo ajustados por hablantes nativos. La localización de 10 más en curso.
La síntesis es esencial para permitir el acceso al contenido a personas con problemas de visión, y que será necesario integrar con la biblioteca ATK siendo usada, así como también con prácticas de alfabetismo, y otras partes de la interfaz gráfica. La localización total involucra la selección de sistemas de síntesis apropiados y su integración al framework ATK, así como la localización del sistema para un dado lenguaje en particular.
La síntesis de habla usualmente no es una buena guía de pronunciación—pero puede llegar a ser mejor que un maestro mediocre que jamás ha tenido la oportunidad de aprenderlo de un nativo de dicho idioma.
- Ver también: Category:Accessibility
Música y Muestras de Sonido
Queremos mucho más que instrumentos masculinos blancos occidentales muertos para compositores masculinos blancos muertos!
Se necesitan muestras limpias y nítidas de sus instrumentos musicales y su música!
Las muestras necesitan de licenciamiento apropiado.
- Ver también TamTam: Sounds
Diccionarios, Correctores Ortográficos, Tesauro
Los idiomas principales ya cuentan con este soporte.
Ortografía, separación (hyphenation), tesauro son necesarios para distintas partes de Linux, que pueden o no aplicarse directamente sobre la OLPC; por ejemplo se puede revisar:
De estos, los primeros tres son de un interés inmediato para la OLPC, ya que usamos versiones de dicho código en el ambiente Sugar.
Reconocimiento de Caracteres
Los reconocedores de escritura y localización son de cierto interes para el puntero/tableta: en el futuro (2ª Generación) cuando dispongamos de una pantalla sensible al tacto, se tornará esencial. xstroke es uno de esos reconocedores de trazos individuales, suficiente para alfabetos con a lo sumo 100 caracteres.
Consideraciones
Limitantes Actuales
Existen limitaciones reales y donde es necesaria la ayuda. Ellos incluyen:
- Calendarios no-gregorianos
- Dígitos no-latinos (Roozbeh Pournader tiene parches, pero no se encuentran integrados y necesitan ayuda).
- Volumen del esfuerzo de localización—que eventualmente requerirá de cambios en la estructura de los proyectos de software libre.
Técnicas de 'Localización'
Solo se requiere de un pequeño equipo para localizar a Linux en un dado idioma: ej.: Galés e Islandés que son idiomas relativamente chicos, han sido bastante localizados por equipos reducidos.
Uno puede hacer el trabajo uno mismo, tercerizarlo, o buscar voluntarios en las universidas (globalmente), la web y la comunidad libre. De ser posible colabore agregando en proyectos ya existentes. Al verificar con algunos de los proyectos de software libre más grandes (Gnome, OpenOffice, Mozilla, KDE), es frecuente encontrarse con gente que ya esta trabajando sobre su idioma.
Trabaje directamente sobre los proyectos de software y contenido en la posible. Esto logra que el trabajo esté disponible a escala mundial, y disminuye el trabajo en curso. Si uno se 'guarda' su trabajo de localización localmente, nadie más se podrá beneficiar de su trabajo y esfuerzo, y tanto el software como el contenido serán más dificiles de localizar.
Herramientas
Algunas herramientas a modo de ejemplo son pootle, kbabel y rosetta. Buena parte del software utiliza las bibliotecas GNU "gettext" y archivos .po estándar, incluyendo a Sugar; Firefox y OpenOffice tienen sus propios sistemas por razones históricas. Wordforge es un buen lugar para conectarse con los esfuerzos sobre herramientas y comunitarios.
El proyecto cldr puede resultar de interés, a pesar que OpenOffice es el primer proyecto importante a usarlo.
Recuerde, colabore/proponga su traducción 'rio arriba' (upstream) para minimizar el esfuerzo a largo plazo: comparta su trabajo con el mundo. No suponga que si una distribución de Linux lo tiene, su esfuerzo se acabó; algunas distribuciones de Linux no son muy buenas en su trabajo comunitario para construir y distribuir el software original.
Licenciamiento
Los textos traducidos usualmente serán útiles en varios proyectos, no solamente el proyecto sobre el que se este trabajando, con lo cual, dado que la licencia MIT/BSD (3 cláusulas) son utilizables por cualquier proyecto, se recomienda su utilización para todas las traducciones y así permitir la mayor distribución y uso.
La licencia SIL OFL es la que se recomienda para las tipografías. Un detalle usualmente ignorado con las tipografías es que son incorporadas en documentos (por ejemplo, dentro de documentos PDF) y que por lo tanto las licencias deben considerar este hecho cuidadosamente.
- Ver también: Licenciamiento de Software
Pasos a Seguir
La localización es local por naturaleza: pero los idiomas generalmente cruzan las fronteras. Por favor, contáctese con Jim Gettys para identificar posibles temas.
Necesitamos identificar personas/organizaciones responsables de idiomas, traduccion, teclados, síntesis de habla, y líderes de la comunidad de software libre para ayudar con los esfuerzos locales y "conocimiento del terreno".
'Localización' de Sugar
Tanto Sugar como las actividades de Sugar utilizan archivos .PO estándar, y pueden ser localizados usando las herramientas usuarles.
'Localización de Linux en General
Visitando los sitios de los proyectos de gnome, mozilla, OpenOffice, KDE se puede entrar en contacto con otros proyectos Linux de interés general y sus traducciones.
Proyectos l10n actuales
- ver la versión en inglés Localization#Current l10n projects.
bolsa de biblioteca
- ver la versión en inglés Localization#library exchange.
actividades
- ver la versión en inglés Localization#activities.
i18n & l10n
- ver la versión en ingles Localization#i18n & l10n.
Grupos de países y descripciones
- ver la versión en inglés Localization#Country groups and descriptions.
Comunidades basadas en Coreano
- ver la versión en inglés Localization#Korean-based Communities.