Localization/lang-es

From OLPC
Jump to navigation Jump to search
  Esta página está supervisada por el equipo de OLPC.
  Traducción de Localization original  
  english | español |日本語 | 한글   +/- cambios  

La tecnología de internacionalización se refiere a la representación y composición de los lenguajes hablados, enseñados y usados en los diferentes países. Localización es el proceso de tomar el software o contenido y adaptarlo a su uso local.

La localización involucra tipografía, diagramación de texto, metodos de entrada, síntesis de habla, intrumentación musical, secuencia de ordenamiento, formatos de fechas y números, diccionarios y correctores ortográficos, entre otros temas.

Linux se encuentra más localizado que MS-Windows ya que no necesita la cooperación del vendedor para ello; dicho esto, la cooperación en la comunidad de software libre y de contenidos es vital para reducir la cantidad de trabajo requerido.

El problema es enorme. Ethnologue tiene una vasta cantidad de informacion sobre los idiomas en el mundo.

Ver también la definición de Wikipedia (en inglés).

A continuación una breve guía de (algunos) de los temas centrales y herramients para la localización.

(Si necesita localizar los símbolos del teclado de la laptop distribuida durante la fase de desarrolladores de nuestro programa, por favor vea las instrucciones que se encuentran en Customizing NAND images/lang-es#Keyboard en este wiki.)

Internationalization technology is the technology for representing and composing the languages spoken, taught or used in your countries. Localization is the process of taking software or content and adapting it for local use.

Localization involves fonts, script layout, input methods, speech synthesis, musical instrumentation, collating order, number & date formats, dictionaries, and spelling checkers, among other issues.

Linux is already more widely localized than Microsoft Windows since no cooperation from a vendor is required to do so: having said this, cooperation with the free software and content community is vital to reduce overall work required.

The size of the problem is huge. Ethnologue has extensive information on the languages of the world.

See also Wikipedia's definition

This is an outline of (some of) the core topics and tools, and issues of localization.

(If you need to localize the keyboard symbols for a laptop issued during the developer-phase of our program, please refer to the instructions found on the Customizing NAND images#Keyboard page of the wiki.)

Temas Básicos de Localización

Juegos de Caracteres

Unicode se encuentra totalmente soportado por las aplicaciones y herramientas "modernas" usadas en el software libre. Conjuntos o juegos de caracteres en desuso también son soportados, pero las aplicaciones modernas usan Unicode.

La secuencia de ordenamiento (collating) del texto se encuentra generalmente bien soportada en las bibliotecas de C.

Ver también: Category:Fonts, Unicode.

Unicode is fully supported in “modern” applications and toolkits used in free software. Legacy character set support also present, but modern applications use Unicode.

Collation order (the text sorting order) is generally well supported in the C library.

See also: Category:Fonts, Unicode.

Diagramación de Texto

La OLPC usa principalmente la biblioteca Pango, capaz de diagramar la mayoría de los idiomas "difíciles", incluyendo: Arábigo, idiomas Hindúes, Hebreo, Persa, Tailandés, etc. Posee un motor de diagramacíon componentizado (pluggable) y soporta tanto el texto vertical así como tambien la diagramación bi-direccional. En general, a pesar de algunos temas, Pango puede manejar la mayoría de los tipos de escrituras; de no ser así se pueden construir módulos específicos, como se especifica en el manual de referencia de Pango (en inglés)

Ver también: Category:Languages (international)

OLPC uses the Pango library, which is bable to layout most of the “hard” languages, including: Arabic, the Indic languages, Hebrew, Persian, Thai, etc. It has a modular puggable layout engine and supports vertical text, as well as supporting bi-directional layout. Overall, some issues remain – but overall Pango is in can handle most scripts already; if it cannot, modules can be built to handle new scripts as documented in Pango's reference manual.

See also: Category:Languages (international)

Tipografía

Con el fin de divulgar contenido y preservar la herencia cultural, la OLPC tiene como meta abarcar todos los idiomas del mundo. Al usar el sistema Fontconfig de Linux nos encontramos en una mejor posición para cubrir más escrituras que otros sistemas. «Fontconfig» es usado para configurar el sistema tipográfico y determinar qué conjunto de tipografías son necesarias para abarcar un conjunto dado de idiomas.

El formato de las tipografías soportado en Linux incluye OpenType, TrueType y otros: ver Freetype para más detalles. La mayoría de los formatos de tipografías soportadas por Freetype son obsoletas, y el mejor resultado en pantalla se logrará usando tipografías OpenType y TrueType, particularmente si han sido apropiadamente insinuadas. Las tipografías Type 1 son útiles para imprimir; el diagramador de tipografías Type 1 en Freetype no es muy bueno, y Type 1 no soporta indicaciones programáticas para pantallas de baja resolución.

La XO-1 de la OLPC tiene una alta resolución de pantalla. Una alta resolución nos ayuda enormemente, en particular en la escala de grises a 200PPP. La Wikipedia (en) es un buen punto inicial para las tipografías libres. «Font Foundries» son empresas especializadas en producir tipografías.

Ver también: Category:Fonts, Fonts, HIG-Texto y Tipografía

To share content and preserve cultural heritage OLPC's goal must be and is full coverage of all the world's languages. By using the Fontconfig system Linux has a better concept of language coverage of fonts than other systems. Fontconfig is used to configure the font system and determine what set of fonts are needed to cover a set of languages.

The formats of fonts supported on Linux include OpenType, TrueType and many others: see Freetype for details. Most of the font formats supported by Freetype are obsolete, and by far the best results on the screen will be had from OpenType and TrueType format fonts, particularly if they are hinted well. Type 1 fonts are useful primarily for printing; the renderer for Type1 fonts in Freetype we have today is not very good, and Type 1 does not support programmatic hinting for low resolution screens.

The OLPC XO-1 has a high resolution screen. High resolution helps OLPC considerably, particularly in grayscale mode at 200DPI. Wikipedia as usual, is a starting point for free fonts. "Font foundries" are companies who will contract to produce fonts.

See also: Category:Fonts, Fonts, HIG-The Sugar Interface/Text and Fonts

Tipografía Libre

Existe tipografía libre para la mayoría de las escrituras mundiales, aunque algunas tienen un licenciamiento inapropiado para su libre re-distribución.

Free fonts are available for most scripts in the world, though some fonts are licensed incorrectly for completely free redistribution.

Necesidad de Tipografías de Pantalla

Nuestras aplicaciones y contenidos deberían ser utilizables en cualquier otra pantalla, no solamente en nuestra pantalla de alta resolución. Con lo cual la comunidad OLPC debe trabajar en expandir la cobertura de tipografías de pantalla de alta calidad. La familia tipográfica "DejaVu" (derivada de Bitstream Vera) cubre la mayoría del alfabetos latinos y algunos otros idiomas. Esta familia tiene en general una buena 'insinuación' (hinting) para su uso en pantalla. El lanzamiento reciente de la familia «Liberation» de Red Hat es una ayuda al momento de reemplazar las familias tipográficas de Microsoft, pero aún carece de una gran cobertura.

SIL International también produce tipografías para una serie de idiomas adicionales de interés local.

Ayudar con éstos u otros esfuerzos de desarrollo de tipografías o aumentar la cobertura de tipografías existentes es muy valioso. El aunar esfuerzos en glifos insinuados (hinting glyphs), importante aunque tedioso, y/o la donación o compras también están siendo exploradas.

Applications and content should be usable on other screens everywhere, not just on OLPC's high resolution screen. Therefore the OLPC community needs to work together on extending the coverage of high quality screen fonts. The "DejaVu" font family (derived from Bitstream Vera) covers most Latin alphabets and some other languages. This family has in general good "hinting" for screen use. The Red Hat "Liberation" family recently became available to help substitute for the Microsoft family of fonts, but does not yet have very wide coverage.

SIL International also builds fonts for a number of additional languages of local interest.

Helping with these or other efforts to build fonts or to increase coverage of existing fonts is greatly appreciated. Pooling efforts on hinting glyphs, which is boring but important work, and/or donations and buyouts are also being investigated.

Teclados

La diagramacion de teclados actual muestra los teclados actualmente disponibles: el incluir nuevas diagramaciones es un trabajo relativamente menor si existen diagramas para dichos idiomas. Gente con experiencia local deberá trabajar con la OLPC para generar nuevas diagramaciones.

Ver también: Category:Keyboard, HIG-Sistemas de Entrada-Teclados

OLPC Keyboard layouts document OLPC's currently available keyboard layouts: further layouts are a modest amount of work if there are existing designs for those languages. People with local expertise will need to work with OLPC staff to generate new layouts.

See also: Category:Keyboard, HIG-Input Systems-Keyboard

Métodos de Ingreso

Un método de entrada, es software que permite la escritura (entrada/tipeo) de caracteres complejos o con más símbolos que teclas, por ejemplo lenguajes como el Chino, Japonés y Coreano.

Sistemas de software libre usan actualmente SCIM - Smart Common Input Method Platform. SCIM remplaza a métodos de ingreso más viejos.

Sabiendo qué idiomas son enseñados como "segundos" idiomas, así como también el/los nativos en una dada área, con el fin de diseñar teclados que sean lo más útiles para cada país. Por ejemplo, el teclado Nigeriano fue diseñado para permitir tanto el Inglés, Hausa y Youba, que son idiomas comunes en buena parte de Nigeria. El "EE.UU./Internacional" cubre la mayoría de los idiomas Europeos.

Todavía quedan pendientes algunos puntos en nuestra tecnología de base. Por ejemplo, las ligaduras en arábigo pueden presentar problemas: al evitar ponerlas en el teclado evitamos la necesidad de un método de entrada. Sin embargo, estas soluciones pueden no ser realizables en su idioma.

Ver también: Input methods, HIG-Sistemas de Entrada

An input method is software that allows typing of scripts with many more characters than keyboard keys. Examples include languages such as Chinese, Japanese, and Korean.

Free software systems now are using SCIM - Smart Common Input Method Platform. SCIM is replacing older input method systems.

Knowing what languages are taught as “foreign” languages, as well as are native in an area is needed to design keyboards that are most useful in each country. For example, the Nigerian keyboard is designed to allow easy entry of English, Hausa, and Yoruba, which are common languages in much of Nigeria. The "US/International" covers most of the western European languages.

Some issues remain in our base technology. For example: Arabic ligatures could present problems: by avoiding putting them on the keyboard we avoided the need for an input method. However, such workarounds may not be feasible for your language.

See also: Input methods, HIG-Input Systems

Accesibilidad y Usabilidad

Síntesis de habla

El sintetizado de voz involucra una serie de concesiones complejas balanceando el tamaño del sintetizador versus la fidelidad versus el esfuerzo de incluir un nuevo idioma. El artículo de Wikipedia sobre la síntesis de habla o voz menciona software actualmente disponible, que incluyen a festival, flite y espeak.

Espeak es lo suficientemente pequeño para ser empaquetado por nosotros y cubre unos cuantos idiomas: ~10 idiomas actualmente siendo ajustados por hablantes nativos. La localización de 10 más en curso.

La síntesis es esencial para permitir el acceso al contenido a personas con problemas de visión, y que será necesario integrar con la biblioteca ATK siendo usada, así como también con prácticas de alfabetismo, y otras partes de la interfaz gráfica. La localización total involucra la selección de sistemas de síntesis apropiados y su integración al framework ATK, así como la localización del sistema para un dado lenguaje en particular.

La síntesis de habla usualmente no es una buena guía de pronunciación—pero puede llegar a ser mejor que un maestro mediocre que jamás ha tenido la oportunidad de aprenderlo de un nativo de dicho idioma.

Ver también: Category:Accessibility

Speech synthesis has a set of complex tradoffs of synthesizer size versus fidelity versus effort to localize a new languag. The Wikipedia speech synthesis article discusses software that is available, which includes festival, flite, and espeak.

Espeak is small enough for us to often bundle and covers quite a few languages: ~10 languages currently supported tuned by native speakers. Localization to ten more languages is underway.

Synthesis is essential for accessibility to content by people with vision problems, and will need to be integrated with the ATK library used, as well as literacy training, other uses as part of a GUI. Full localization therefore involves selection of a suitable synthesis system and integration into the ATK framework, along with localization of that system for the particular language involved.

Speech synthesis is usually not a good guide for pronunciation – but it may be better than a poor teacher who has never had the opportunity to learn from a native speaker of that language.

See also Category:Accessibility

Música y Muestras de Sonido

Queremos mucho más que instrumentos masculinos blancos occidentales muertos para compositores masculinos blancos muertos!

Se necesitan muestras limpias y nítidas de sus instrumentos musicales y su música!

Las muestras necesitan de licenciamiento apropiado.

Ver también TamTam: Sounds

We want much more than dead white male western instruments for dead white male composers!

Clean samples of your musical instruments and music needed!

Samples need appropriate licensing terms.

See also TamTam: Sounds

Diccionarios, Correctores Ortográficos, Tesauro

Los idiomas principales ya cuentan con este soporte.

Ortografía, separación (hyphenation), tesauro son necesarios para distintas partes de Linux, que pueden o no aplicarse directamente sobre la OLPC; por ejemplo se puede revisar:

De estos, los primeros tres son de un interés inmediato para la OLPC, ya que usamos versiones de dicho código en el ambiente Sugar.

There is existing support for most major languages.

Spelling, Hyphenation, Thesaurus dictionaries may be needed for different parts of Linux, which may or may not apply to OLPC directly; for example you can check:

Of these, the first three are most immediately interesting to OLPC, as we use versions of these codebases as part of the Sugar environment.

Reconocimiento de Caracteres

Los reconocedores de escritura y localización son de cierto interes para el puntero/tableta: en el futuro (2ª Generación) cuando dispongamos de una pantalla sensible al tacto, se tornará esencial. xstroke es uno de esos reconocedores de trazos individuales, suficiente para alfabetos con a lo sumo 100 caracteres.

Stroke/character recognizer localization is of some interest with the pen/tablet: in the future (Gen 2) when we have a touch screen they will become essential. xstroke is one such individual character/stroke recognizer, sufficient for alphabets of up to about 100 characters.

Consideraciones

Limitantes Actuales

Existen limitaciones reales y donde es necesaria la ayuda. Ellos incluyen:

  • Calendarios no-gregorianos
  • Dígitos no-latinos (Roozbeh Pournader tiene parches, pero no se encuentran integrados y necesitan ayuda).
  • Volumen del esfuerzo de localización—que eventualmente requerirá de cambios en la estructura de los proyectos de software libre.

There are some real shortcomings where help is needed. These include:

  • Non-Gregorian calendars
  • Non-Latin digits (Roozbeh Pournader has patches, but these are not yet integrated and may need help).
  • and the sheer scale of the localization problem will eventually require changes in free software projects.

Técnicas de 'Localización'

Solo se requiere de un pequeño equipo para localizar a Linux en un dado idioma: ej.: Galés e Islandés que son idiomas relativamente chicos, han sido bastante localizados por equipos reducidos.

Uno puede hacer el trabajo uno mismo, tercerizarlo, o buscar voluntarios en las universidas (globalmente), la web y la comunidad libre. De ser posible colabore agregando en proyectos ya existentes. Al verificar con algunos de los proyectos de software libre más grandes (Gnome, OpenOffice, Mozilla, KDE), es frecuente encontrarse con gente que ya esta trabajando sobre su idioma.

Trabaje directamente sobre los proyectos de software y contenido en la posible. Esto logra que el trabajo esté disponible a escala mundial, y disminuye el trabajo en curso. Si uno se 'guarda' su trabajo de localización localmente, nadie más se podrá beneficiar de su trabajo y esfuerzo, y tanto el software como el contenido serán más dificiles de localizar.

It only takes a small team to localize Linux for a language: e.g. Welsh, Icelandic, which are relatively small languages, have been pretty fully localized by small teams.

You can do the work yourself, hire the work out, or find volunteers among universities (worldwide), the world wide internet and free software community. Add to existing projects whenever possible. By checking with some of the major free software projects (e.g. Gnome, OpenOffice, Mozilla, KDE), you can often locate people already at work in your language.

Work directly in the software and content projects whenever possible. This makes your work available worldwide, while lessens the ongoing work. If you keep your localization work local, others cannot benefit from your work and effort and your software and content will be that much harder to localize.

Herramientas

Algunas herramientas a modo de ejemplo son pootle, kbabel y rosetta. Buena parte del software utiliza las bibliotecas GNU "gettext" y archivos .po estándar, incluyendo a Sugar; Firefox y OpenOffice tienen sus propios sistemas por razones históricas. Wordforge es un buen lugar para conectarse con los esfuerzos sobre herramientas y comunitarios.

El proyecto cldr puede resultar de interés, a pesar que OpenOffice es el primer proyecto importante a usarlo.

Recuerde, colabore/proponga su traducción 'rio arriba' (upstream) para minimizar el esfuerzo a largo plazo: comparta su trabajo con el mundo. No suponga que si una distribución de Linux lo tiene, su esfuerzo se acabó; algunas distribuciones de Linux no son muy buenas en su trabajo comunitario para construir y distribuir el software original.

Some example tools include pootle, kbabel and rosetta. Most software uses the GNU “gettext” libraries and standard .po files, including Sugar; Firefox and OpenOffice have their own systems for historical reasons. Wordforge is a good place to get plugged into tools and the community efforts.

The cldr project is worth watching, though OpenOffice is the first major project using this.

Remember, contribute your translations to the “upstream” projects to minimize long term effort: share your work with the world. Do not presume that if one Linux distribution has your effort that you are finished; some Linux distributions are not good about working with the community that builds and distributes the original software.

Licenciamiento

Los textos traducidos usualmente serán útiles en varios proyectos, no solamente el proyecto sobre el que se este trabajando, con lo cual, dado que la licencia MIT/BSD (3 cláusulas) son utilizables por cualquier proyecto, se recomienda su utilización para todas las traducciones y así permitir la mayor distribución y uso.

La licencia SIL OFL es la que se recomienda para las tipografías. Un detalle usualmente ignorado con las tipografías es que son incorporadas en documentos (por ejemplo, dentro de documentos PDF) y que por lo tanto las licencias deben considerar este hecho cuidadosamente.

Ver también: Licenciamiento de Software
Translated strings will often be useful among many projects, not just the the project you are working on translating, therefore, since the MIT/BSD (3 clause) licenses are usable by all projects, these are the safest licenses to use for translation to enable widest sharing.

The SIL OFL license recommended for Fonts. An often overlooked issue with fonts is that they are incorporated into documents themselves (for example, into PDF documents) and that therefore licensing needs to be considered carefully.

See also Software licensing

Pasos a Seguir

La localización es local por naturaleza: pero los idiomas generalmente cruzan las fronteras. Por favor, contáctese con Jim Gettys para identificar posibles temas.

Necesitamos identificar personas/organizaciones responsables de idiomas, traduccion, teclados, síntesis de habla, y líderes de la comunidad de software libre para ayudar con los esfuerzos locales y "conocimiento del terreno".

Localization is by nature local: but languages often crosses borders. Please contact Jim Gettys to identify issues.

We need identified people/organizations responsible for language, translation, keyboards, speech synthesis, an effective free software community leaders to help with local deployment and "on the ground" knowledge.

'Localización' de Sugar

Tanto Sugar como las actividades de Sugar utilizan archivos .PO estándar, y pueden ser localizados usando las herramientas usuarles.

Sugar and sugar applications use standard .po files, and can be localized using the usual tools.

'Localización de Linux en General

Visitando los sitios de los proyectos de gnome, mozilla, OpenOffice, KDE se puede entrar en contacto con otros proyectos Linux de interés general y sus traducciones.

By looking at the gnome, mozilla, OpenOffice, KDE projects, you can get plugged into translating other Linux software of general interest.

Proyectos l10n actuales

ver la versión en inglés Localization#Current l10n projects.

bolsa de biblioteca

ver la versión en inglés Localization#library exchange.

actividades

ver la versión en inglés Localization#activities.

i18n & l10n

ver la versión en ingles Localization#i18n & l10n.

Grupos de países y descripciones

ver la versión en inglés Localization#Country groups and descriptions.

Comunidades basadas en Coreano

ver la versión en inglés Localization#Korean-based Communities.