O aprendizado de máquina ganha características sociais na Carnegie Mellon University, na Pensilvânia

A equipe ArticuLab, da Carnegie Mellon University, queria entender como os assistentes robóticos podem colaborar com as pessoas para realizar tarefas e desenvolver relacionamentos, em vez de apenas substituir o trabalho humano. Para estudar as interações dos robôs com as pessoas e treinar os agentes com consciência social, a equipe usou o Machine Learning Engine do Google Cloud Platform.

A inteligência artificial com algumas habilidades sociais

O Encontro Anual de Novos Campeões de 2016, organizado pelo Fórum Econômico Mundial, aconteceu em Tianjin, na China, e contou, entre outros eventos, com a grande estreia da SARA, sigla em inglês para "Socially Aware Robot Assistant" (assistente robótica com consciência social), que interage com as pessoas de forma inédita. Em vez de apenas substituir a função de um assistente humano, ou de processar e apresentar informações de maneira impessoal, a SARA é diferente: intuitiva, simpática, cativante e criada para "colaborar" com os usuários humanos, reconhecer e responder às expressões faciais deles, aprender preferências e melhorar o desempenho nas tarefas com base nos usuários com quem ela interage. Ela também foi programada para aprender determinadas pistas sociais, movimentar a cabeça enquanto um usuário fala e entender entonações diferentes.

Meses depois, em janeiro de 2017, o projeto foi apresentado no Fórum Econômico Mundial em Davos, na Suíça, sendo a única demonstração no Centro de Conferências de Davos. A SARA funcionou como uma assistente pessoal virtual, dando informações aos participantes sobre as sessões programadas, facilitando o contato entre eles, recomendando lugares para comer e muito mais.

Inicialmente, a SARA era uma assistente pessoal virtual com uma função específica: ajudar na conferência e interagir com os convidados. Ela conseguiu aprender sobre os interesses e objetivos dos líderes mundiais para recomendar sessões do interesse deles com eficiência. Melhor ainda, a SARA usou as conversas para desenvolver relacionamentos com cada pessoa que falou com ela, aprendendo mais sobre as preferências e os objetivos delas. Assim, ela poderá melhorar o desempenho nas tarefas em conversas futuras, ajudando de maneira ainda mais personalizada.

A SARA foi criada pela ArticuLab, uma equipe pequena da Carnegie Mellon University, cujo objetivo é aprimorar os sistemas computacionais com as interações humanas em contextos sociais e culturais que, por sua vez, nos ajudam a entender melhor as interações humanas. Como as pessoas se comunicam com a tecnologia, e como essa comunicação pode melhorar com o tempo? Cultivar os laços sociais é importante, já que eles são fundamentais entre as pessoas. A equipe ArticuLab afirmou o seguinte sobre a SARA: "Em vez de ignorar os laços sociais e emocionais que estruturam a sociedade, a SARA depende deles para aprimorar as habilidades de colaboração".

O que dizem os pesquisadores

"O GCP está acelerando as pesquisas acadêmicas sobre a inteligência artificial."

Yoichi Matsuyama, pesquisador de pós-doutorado do Instituto de Tecnologias Linguísticas e chefe de projeto da SARA

Ferramentas do Google usadas na criação da SARA

Chefiada por Justine Cassell, reitora adjunta de impacto e estratégia de tecnologia na faculdade de ciência da computação da Carnegie Mellon University, a equipe ArticuLab já conhecia o Google Cloud Platform (GCP) antes da SARA, graças às ferramentas e ao financiamento de outros projetos de pesquisa. Yoichi Matsuyama, pesquisador do pós-doutorado do Instituto de Tecnologias Linguísticas e chefe de projeto da SARA, conta: "Como já usávamos o TensorFlow em várias tarefas de aprendizado de máquina, usar o GCP nos nossos projetos recentes de aprendizado profundo foi uma transição natural. Também utilizamos diversas APIs do Google, como a Google Speech API (reconhecimento de fala) nos agentes conversacionais e o Firebase nas estruturas de coleta de dados por crowdsourcing". O GCP continuará sendo usado conforme a SARA atingir novos domínios e aplicações. "Ainda estamos em fase de implantação", ele comenta, destacando que "o GCP está acelerando as pesquisas acadêmicas sobre a inteligência artificial".

Yoichi conta que o laboratório está usando bastante o Compute Engine, incluindo instâncias de GPU com 4 Nvidia Tesla K80 e o TensorFlow. Neste ano, a equipe está trabalhando em modelos, como o de raciocínio social baseado no aprendizado profundo de reforço em contextos de tarefas e o de geração de linguagem natural socialmente condicionada.

Avaliando a experiência que podemos chamar de SARA 1.0 (o lançamento no Fórum Econômico Mundial), Yoichi afirma: "Mais de 250 participantes tentaram usar a SARA em uma conferência de quatro dias. No geral, foi um sucesso, mas ainda estamos analisando os resultados positivos e negativos. Uma grande conclusão desses dados é o que chamamos de 'comunicação' (as relações interpessoais) que, na verdade, está relacionada ao desempenho nas tarefas. E, nesse caso, ela afetou a aceitação das recomendações. Quando a comunicação era harmoniosa, e a SARA estabelecia bem o relacionamento com o usuário, era mais provável que ele aceitasse as recomendações dela. Essa é nossa maior conclusão até agora, mas continuamos analisando os dados".

Ampliando novos domínios, inclusive a educação

Parece que o trabalho da SARA está apenas começando. Até agora, outras aplicações da "inteligência artificial com consciência social" da equipe ArticuLab incluem a educação, como auxiliar crianças em escolas públicas com poucos recursos e incentivar a colaboração entre colegas. Isso provou ser fundamental para aprimorar a aprendizagem, além de auxiliar crianças autistas de alto funcionamento e com Síndrome de Asperger a desenvolver habilidades sociais interativas para melhorar os relacionamentos interpessoais.

Michael Madaio, doutorando no Instituto de Interação Humano-Computador e chefe de projeto do RAPT, sigla em inglês para "Rapport-Aware Peer Tutor" (ensino entre alunos com base na comunicação), observa que, nos dados das aulas particulares "de humano para humano" que foram coletados, a "comunicação entre os alunos em colaboração estava muito associada à participação na tarefa, à capacidade de resolver problemas e, por fim, à aprendizagem deles". Em outras palavras, o trabalho em conjunto, socialmente, pode beneficiar todos.

Ao desenvolver a comunicação na aprendizagem para recursos educacionais, Michael observa que a equipe quer oferecer ferramentas que não apenas ajudem os alunos a aprender. Segundo ele: "Já existem plataformas de aprendizagem disponíveis, mas o que a pesquisa educacional mostra é que os alunos não são máquinas de processamento de informações que computam números. Existe uma base social. E, para aprender, é importante criar esse vínculo com os outros alunos. Isso também vale quando um professor particular virtual dá o feedback: se ele precisa dizer que o aluno está errado, como fazer isso? Talvez no começo ele seja mais sutil, mais indireto, para não parecer agressivo. Mas, com o tempo, depois que o relacionamento está estabelecido, ele pode ser um pouco mais direto e dar ao aluno um feedback mais específico, que realmente ajudará".

Michael comenta que, se o professor particular virtual apresenta bom desempenho, "a probabilidade de que o aluno queira voltar aumenta", o que é importante, assim como o nível de participação dos alunos. Segundo ele: "O foco não é apenas no retorno dos alunos quando eles precisarem de ajuda, mas no processo: como eles estão interagindo com o professor particular virtual? Estão mais participativos? Estão aprendendo a compartilhar os próprios objetivos e ansiedades em relação à aprendizagem?" É criado um vínculo que, como qualquer outro, precisa se estabelecer gradualmente. No entanto, como a SARA provou, o mais incrível é que esse vínculo pode acontecer.

Até o momento, a resposta nas aplicações educacionais tem sido positiva. Entretanto, Michael conta: "Ainda não fizemos uma implantação em uma escola. Parte do nosso desafio de criação neste ano é identificar a natureza de uma implantação em grande escala". A equipe está tentando imaginar como será essa futura implantação, talvez criando uma rede de suporte para dever de casa entre alunos ou alfabetizadores particulares para os alunos com dificuldade de leitura.

Embora não existam planos para um sistema de aulas particulares virtuais na Carnegie Mellon University, a equipe poderia implementar um assistente pessoal para informar os alunos sobre as próximas palestras no campus, recomendar eventos e muito mais. Talvez o objetivo mais ambicioso da equipe ArticuLab seja criar uma versão da SARA que consiga trabalhar não apenas em uma conferência de 4 dias, mas 24 horas por dia, 7 dias por semana, em vários domínios. Essa é uma ideia desafiadora, mas instigante, com possibilidades infinitas.

O que dizem os pesquisadores

"O foco não é apenas no retorno dos alunos quando eles precisarem de ajuda, mas no processo: como eles estão interagindo com o professor particular virtual? Estão mais participativos? Estão aprendendo a compartilhar os próprios objetivos e ansiedades em relação à aprendizagem?"

Michael Madaio, doutorando, Instituto de Interação Humano-Computador

Perfil da organização

Fundada em 1900 por Andrew Carnegie como Escolas Técnicas Carnegie, em 1912 a instituição mudou de nome para Instituto de Tecnologia Carnegie, passando a oferecer cursos com quatro anos de duração. Mais de 50 anos depois, associou-se ao Instituto Mellon de Pesquisa Industrial para formar a Carnegie Mellon University, uma universidade de pesquisa mundial em Pittsburgh, na Pensilvânia, Estados Unidos. Hoje reconhecida pelos programas interdisciplinares de alto nível que incluem artes, administração, computação, engenharia, ciências humanas, política e ciências, a universidade tem quase 14.000 alunos de mais de 100 países.

Produtos usados

Agradecemos sua inscrição.

Indique abaixo seus interesses.