Переводчики поделились своими "параллельными текстами"

Еврокомиссия, где трудится 1750 переводчиков, бесплатно выложила в интернет..

тексты в формате TMX общим объемом в миллион предложений. Каждое из предложений качественно переведено на 22 из 23 языков Евросоюза.

Ожидается, что корпус текстов особенно поможет программистам, разрабатывающим системы автоматического перевода и проверки орфографии.

Основную часть корпуса составили законы ЕС. Ведомства Евросоюза постоянно переводят документы, так как правила требуют, чтобы каждый закон ЕС существовал в 23 вариантах - по числу официальных языков блока.

Служащие Еврокомиссии работают с 253 языковыми парами и переводят по полтора миллиона страниц в год.

Одна беда: на русском не выложили ;) Также в корпусе текстов не хватает перевода на ирландский язык.