IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
Pessoa a observar o céu

De 15 a 18 de fevereiro, a Física está em destaque na cidade de Lisboa, no Encontro Nacional de Estudantes de Física (ENEF). Este é um evento que pretende reunir estudantes e profissionais na Ciências ULisboa, procurando dar uma perspetiva diferente do ensino da Física a nível universitário.

Revegetação com especies autoctones

“O projeto em curso no Lousal mostra que é possível conciliar a atividade de mineração com a devolução do território à natureza com o mínimo impacto possível”, escreve Jorge Buescu na crónica publicada na revista Ingenium n.º 183, referente ao primeiro trimestre de 2024.

Pontos de interrogação

 Vladimir Konotop, professor da Ciências ULisboa, participou num estudo publicado este mês na Nature Photonics - “Observação da Localização da Luz em Quasicristais Fotónicos” -, em colaboração com investigadores da Universidade Jiao Tong de Xangai (China) e da Academia de Ciências Russa  (Rússia).

Aluna a fazer uma apresentação numa sala de aula

Inês Sofia Cruz Dias e Ana Carolina Preto Oliveira, estudantes da Ciências ULisboa, apresentaram os seus relatórios da disciplina Voluntariado Curricular, 1.º semestre, no passado dia 22 de janeiro. Sensibilizar os estudantes para as temáticas da solidariedade, tolerância, compromisso, justiça e responsabilidade social e proporcionar-lhes oportunidades para o desenvolvimento de competências transversais são alguns dos objetivos do Voluntariado Curricular.

Cristina Simões, Fernando Antunes, José Pereira-Leal, Jorge Maia Alves, Andreia Valente, Hugo Ferreira, Rui Ferreira e Pedro Almeida

Os projetos Lusoturf e TAMUK são os vencedores da 1.ª edição do Concurso de Projetos de Inovação Científica, uma iniciativa promovida pela Ciências ULisboa e FCiências.ID, com o apoio do Tec Labs.

Membro da FLAD, Marcelo Rebelo de Sousa e José Ricardo Paula

José Ricardo Paula, investigador da Ciências ULisboa, vencedor do FLAD Science Award Atlantic 2023, teve a honra de receber o prémio pelas mãos do Presidente da República, Marcelo Rebelo de Sousa. Para o diretor da Ciências ULisboa, Luís Carriço, este prémio é um reconhecimento do mérito e da excelência da investigação que se faz na faculdade: “Estou muito orgulhoso, mas não estou surpreendido. O trabalho que o José Ricardo Paula desenvolveu é brilhante e o próprio Presidente da República fez questão de referir isso. O nosso investigador está de parabéns, bem como a faculdade”.

Ana Sofia Reboleira

O projeto “Barrocal-Cave: Conservation, monitoring and restoration assessment of the world-class cave biodiversity hotspot in Portugal foi distinguido com o 2.º lugar do Prémio Fundação Belmiro de Azevedo 2023. Ana Sofia Reboleira é a investigadora responsável por este projeto, que tem como instituição proponente a FCiências.ID.

Fotografia de Henrique Leitão

O Papa nomeou a 10 de janeiro o cientista Henrique Leitão como membro do Comité Pontifício de Ciências Históricas, informou o Vaticano. A Agência Ecclesia refere que o novo membro deste comité colaborou com o Secretariado Nacional dos Bens Culturais da Igreja, enquanto coautor do ‘Clavis Bibliothecarum‘ (2016), um levantamento de catálogos e inventários de bibliotecas da Igreja Católica em Portugal.

Fotografia de Beatriz Amorim

Beatriz Amorim foi premiada com uma bolsa Marie Sklodowska-Curie, uma iniciativa da Agência Internacional de Energia Atómica (AIEA, sigla em inglês). A estudante do último ano de mestrado em Engenharia Física, na Ciências ULisboa, participa a partir de 15 de janeiro e durante seis meses, num projeto inovador na Alemanha, no âmbito do Programa GET_INvolved do FAIR.

Henrique de Gouveia e Melo e Henrique Leitão

“As três últimas décadas foram excecionais para os estudos de História Marítima, da Ciência Náutica, da Cosmografia e da Cartografia portuguesas”, diz Henrique Leitão, investigador da Ciências ULisboa, a propósito da atribuição do Prémio Academia de Marinha 2023, ocorrido no passado dia 9 de janeiro, durante a Sessão Solene de Abertura do Ano Académico de 2024.

Membros da expedição em frente do RV Pelagia

A Ciências ULisboa destacou no passado mês de dezembro - na EurekAlert - uma história sobre um estudo, que relata evidências sem precedentes de respostas ecológicas do fitoplâncton calcificante à deposição de nutrientes fornecidos pela poeira do Sara. O trabalho publicado na Frontiers in Marine Science tem como primeira autora Catarina Guerreiro, micropaleontóloga e investigadora em bio geociências marinhas na Ciências ULisboa.

Cientista em gruta

Um estudo publicado na Scientific Reports e coordenado por Ana Sofia Reboleira, professora no Departamento de Biologia Animal da Ciências ULisboa e investigadora no Centro de Ecologia, Evolução e Alterações Ambientais (cE3c), analisou mais de 100000 medições de temperaturas em grutas localizadas em diversas zonas climáticas, desde as tropicais às subárticas, passando por Portugal continental e ilhas.

Identidade gráfica da crónica com imagem de Andreia Sofia Teixeira

A crónica da autoria da Comissão de Imagem do Departamento de Informática da Ciências ULisboa visa realçar a investigação feita pelos docentes e investigadores deste departamento. A segunda crónica dá a conhecer Andreia Sofia Teixeira.

Pessoas junto ao edifício do MARE, na Ciências ULisboa

Com o intuito de colaborar no desenvolvimento de um parque eólico offshore flutuante ao largo da Figueira da Foz, o MARE e a IberBlue Wind (IBW) assinaram a 5 de dezembro passado um protocolo que estabelece os moldes da parceria futura. A colaboração da IBW com o MARE irá permitir estudar os eventuais impactos da instalação da infraestrutura nos ecossistemas marinhos da área de implementação, e propor soluções que mitiguem os eventuais impactos negativos na componente ecológica e na atividade da pesca.

A Ciências ULisboa foi palco do mais recente workshop da International Atomic Energy Agency (IAEA). O “Regional Workshop on Nuclear and Radiation Education - Strategies and Approaches to Enhance Capacity Building in Nuclear Education and Training” realizou-se entre os dias 4 e 7 de dezembro e contou com a presença de 37 representantes de 25 países europeus e asiáticos, assim como de especialistas internacionais e delegados da IAEA.

Ricardo Trigo e membros da ULisboa e CGD

Ricardo Trigo é professor no Departamento de Engenharia Geográfica, Geofísica e Energia e investigador no Instituto Dom Luiz, no RG1 – Climate change, atmosphere-land-ocean processes and extremes. Este ano foi distinguido, pela segunda vez, pela ULisboa e Caixa Geral da Depósitos (CGD) com um prémio científico, na área das Ciências da Terra e Geofísica. O primeiro prémio científico atribuído pela ULisboa e pela CGD ao cientista ocorreu em 2017. Leia a entrevista com o cientista e saiba o que pensa sobre esta distinção e em que consiste a sua investigação.

salão nobre da Reitoria da ULisboa

Na edição de 2023 dos Prémios Científicos ULisboa / Caixa Geral de Depósitos (CGD) foram atribuídos 20 prémios e 20 menções honrosas a professores e investigadores da Universidade. Os cientistas da Ciências ULisboa alvo desta distinção foram Alysson Bessani, Ricardo Trigo e Vladimir Konotop, com prémios no valor de 6.500€; e Carla Silva, Jaime Coelho, José P. Granadeiro e Rita Margarida Tavares, com menções honrosas.

Luís Carriço e memebros da ULisboa e CGD

José P. Granadeiro é professor no Departamento de Biologia Animal e investigador no grupo de investigação Biologia da Adaptação e Processos Ecológicos do Centro de Estudos do Ambiente e do Mar (CESAM). Este ano foi distinguido pela ULisboa e pela Caixa Geral da Depósitos (CGD) com uma menção honrosa, na área de Biologia, Engenharia Biológica, Bioquímica e Biotecnologia. Leia a entrevista com o cientista e saiba o que pensa sobre esta distinção e em que consiste a sua investigação.

Imagem gráfica da rubrica com fotografia de André Rodrigues

A crónica da autoria da Comissão de Imagem do Departamento de Informática da Ciências ULisboa visa realçar a investigação feita pelos docentes e investigadores deste departamento. A primeira dá a conhecer André Rodrigues.

Carla Silva com membros da ULisboa e da CGD

Carla Silva é professora no Departamento de Engenharia Geográfica, Geofísica e Energia e investigadora no Instituto Dom Luiz, no RG5 – Energy Transition. Este ano foi distinguida pela ULisboa e pela Caixa Geral da Depósitos com uma menção honrosa, na área de Engenharia do Ambiente e Energia. Leia a entrevista com a cientista e saiba o que pensa sobre esta distinção e em que consiste a sua investigação.

Rita Margarida Cardoso e membros da ULisboa e CGD

Rita Margarida Cardoso é investigadora no Departamento de Engenharia Geográfica, Geofísica e Energia e investigadora no Instituto Dom Luiz (IDL), no RG1 – Climate change, atmosphere-land-ocean processes and extremes. Este ano foi distinguido pela ULisboa e pela Caixa Geral da Depósitos (CGD) com uma menção honrosa, na área das Ciências da Terra e Geofísica. Leia a entrevista com a cientista e saiba o que pensa sobre esta distinção e em que consiste a sua investigação.

Vladimir Konotop e membros da ULisboa e da CGD

Vladimir Konotop é professor no Departamento de Física e investigador no Centro de Física Teórica e computacional da Ciências ULisboa. Este ano foi distinguido pela segunda vez, pela ULisboa e pela Caixa Geral da Depósitos (CGD) com um prémio científico, na área de Física e Materiais. O primeiro prémio científico atribuído pela ULisboa e pela CGD ao cientista ocorreu em 2017. Leia a entrevista com o cientista e saiba o que pensa sobre esta distinção e em que consiste a sua investigação.

Alysson Bessani e membros da ULisboa e CGD

Alysson Bessani é professor no Departamento de Informática e investigador no LASIGE Computer Science and Engineering Research Centre da Ciências ULisboa. Este ano foi distinguido pela ULisboa e pela Caixa Geral da Depósitos (CGD) com um prémio científico, na área das Ciências da Computação e Engenharia Informática. Leia a entrevista com o cientista e saiba o que pensa sobre esta distinção e em que consiste a sua investigação.

José Ricardo Paula

José Ricardo Paula, investigador auxiliar júnior no Departamento de Biologia Animal da Ciências ULisboa e no Centro de Ciências do Mar e do Ambiente (MARE), é o vencedor da 4.ª edição do FLAD Science Award Atlantic, atribuído pela Fundação Luso-Americana para o Desenvolvimento (FLAD). De acordo com o comunicado de imprensa emitido pela FLAD, “José Ricardo Paula irá receber 300 mil euros de financiamento, em três anos, para desenvolver uma ideia inovadora, nomeadamente, o projeto ‘ATLANTICDIVERSA’, que pretende contribuir para compreender o papel dos mutualismos de limpeza na conservação da Biodiversidade do Atlântico, com recurso a tecnologias emergentes, como a Inteligência Artificial”.

Movimento de partículas ativas em meios desordenados

Sabia que quando um conjunto de robots ou bactérias se move num espaço onde há vários objetos livres, esses robots ou bactérias desviam esses objetos para poderem passar? Um grupo de investigadores da Ciências ULisboa e das universidades de College of London (Reino Unido) e de Gothenburg (Suécia) conseguiu mostrar que o rasto deixado por esse movimento contribui para a formação de grupos, funcionando como um mecanismo efetivo de comunicação entre eles.

Páginas