uiux.pt

Teste de usablidade. Quantos users? Como medir? Para que serve?

Os testes de usabilidade permitem uma avaliação de um produto ou serviço, testando-o com utilizadores reais.


Os testes de usabilidade permitem uma avaliação de um produto ou serviço, testando-o com utilizadores reais. Normalmente, durante o teste, os participantes tentam concluir as tarefas apresentadas no guião enquanto nós, avaliadores, assistimos, ouvimos e recolhemos apontamentos. O objetivo destes testes é identificar problemas de usabilidade, recolher dados qualitativos e quantitativos e determinar a satisfação do utilizador com o produto (Leavitt, 2006) (Travis & Hodgson, 2019).

Segundo estudos realizados por Nielsen & Landauer (1993) os melhores resultados provêm de testes com cinco utilizadores. Esta teoria pode confirmar-se através de cálculos efetuados por ambos, que comprovam o número de erros detetados consoante o número de utilizadores submetidos aos testes. O número de problemas de usabilidade detetados nos testes de usabilidade com N utilizadores é:

N (1- (1- L)n)

Sendo N o número total de problemas de usabilidade na interface e L a proporção de problemas de usabilidade detetados quando um único utilizador testa a interface. Em média, na maioria dos projetos estudados o valor de L é 31%. Quando é traçada a curva no gráfico sendo L=31% obtém-se o seguinte resultado:

Gráfico de percentagens com número de problemas de usabilidade encontrados durante um teste de usabilidade com “n” tilizadores (Nielsen, 2012).

O gráfico inicia-se com o número de zero utilizadores sendo também zero o número de insights.

Assim que são recolhidos dados de um único utilizador durante um teste, os insights aumentam e conseguimos detetar quase um terço de tudo o que há para detetar sobre a usabilidade da interface em questão.

Ao realizar o teste com o segundo utilizador, descobrimos que algumas ações coincidem com o primeiro utilizador, portanto, há alguma sobreposição nos problemas e insights recolhidos. Todos os utilizadores são diferentes, sendo que, haverá algo de novo que o segundo utilizador fez que não foi observado com o primeiro utilizador. Logo, o segundo utilizador acrescenta uma nova perceção, mas menos completa.

O terceiro utilizador irá realizar muitas coisas que já foram observadas com os utilizadores anteriores.

À medida que são adicionados novos utilizadores, são detetados cada vez menos problemas.

A curva apresentada no gráfico mostra claramente que é necessário testar com pelo menos 15 utilizadores para descobrir todos os problemas de usabilidade na interface.

Sendo assim, devemos realizar vários testes, porque o principal objetivo da análise da usabilidade é melhorar a experiência do utilizador e não documentar apenas as suas fraquezas. Após o primeiro estudo com cinco utilizadores, é possível encontrar 85% dos problemas de usabilidade. 

Existem diversas técnicas para realizar testes de usabilidade, sendo fundamental determinar a técnica a utilizar consoante o produto em questão bem como o tipo de resultados a obter depois do teste. A técnica mais comum, que permite uma grande diversidade de dados recolhidos é o think-aloud.

O thinking-aloud, pensar em voz alta, é um método da psicologia cognitiva para o estudo da memória de curto prazo. No entanto, é aplicado como forma de avaliação durante os testes de usabilidade. Os utilizadores submetidos aos testes, são solicitados a fazer comentários enquanto realizam as tarefas. Este método é fundamental para estudar problemas cognitivos que estejam presentes na interface (Lewis, 1982).

Existe um grande número de estudos que comprova que esta técnica permite um acesso ao processo cognitivo, ao comportamento mental do utilizador e ainda permite uma visão do seu pensamento.

Karsenty (2001), argumenta que pensar em voz alta pode ser utilizado para identificar processos cognitivos responsáveis pelo comportamento dos utilizadores. Sublinha ainda que esta técnica coloca uma carga cognitiva elevada no utilizador e requer um envolvimento que pode interferir ou até mesmo competir com os requisitos cognitivos da interação na realização das tarefas. No entanto, permite-nos identificar diferentes pontos psicológicos de diferentes utilizadores. Estes pontos, quando analisados fornecem informações sobre os comportamentos e pensamentos do utilizador perante a interface e perante os erros/alertas da mesma.

Um dos aspetos positivos deste método é o facto dos utilizadores providenciarem um feedback durante a utilização da interface o que permite obter respostas que vão mais de encontro com a realidade do que as respostas obtidas após a conclusão do teste. Quando este feedback é fornecido através de questionários ou debrifings os utilizadores são forçados a recordar-se da funcionalidade da interface e de que forma interagem com ela, podendo interferir com as respostas não obtendo um nível de precisão elevado.

Depois de realizar cada teste de usabilidade, para uma documentação mais eficaz e completa o utilizador pode ser submetido a um breve questionário, denominado de: System Usability Scale (SUS) (Brooke, 1996).

O SUS, criado originalmente por John Brooke em 1986 é uma ferramenta eficaz para avaliar a usabilidade de uma determinada interface, incluindo websites, sistemas digitais, televisões entre muitos outros produtos onde exista uma Interação Homem-Computador. O questionário é composto por uma série de dez perguntas, cada pergunta contém uma escala de cinco pontos, 0 para totalmente de desacordo e 5 para totalmente de acordo (Bangor, Kortum, & Miller, 2009).

O questionário deve ser preenchido logo após o fim do teste de usabilidade, sem qualquer debrifing prévio. Os utilizadores devem registar as suas respostas de uma forma imediata para cada pergunta, sem qualquer pensamento demorado sobre a questão. Se por alguma razão o utilizador não conseguir responder a uma determinada questão, deve ser selecionado automaticamente o valor correspondente ao meio da escala, neste caso o número 3 (Bangor et al., 2009) (Brooke, 2013).

O SUS já conta com mais de 25 anos de existência, sendo utilizado em diferentes contextos. Consequentemente, existe um aumento da riqueza da informação recolhida quando utilizado em conjunto com outras técnicas, tal como complemento dos testes de usabilidade.

Bibliografia:
Leavitt, M. O. (2006). Research-Based Web Design & Usability Guidelines.
Travis, D., & Hodgson, P. (2019). Think Like a UX Researcher. CRC Press.
Nielsen, J., & Landauer, T. K. (1993). A Mathematical Model of the Finding of Usability Problems, 206–213.
Lewis, C. (1982). Using the “ Thinking-aloud “ Method in Cognitive Interface
Design.
Karsenty, L. (2001). Adapting verbal protocol methods to investigate speech
systems use
, 32, 15–22.
Bangor, A., Kortum, P., & Miller, J. (2009). Determining What Individual SUS Scores Mean : Adding an Adjective Rating Scale, 4(3), 114–123.
Brooke, J. (2013). SUS : A Retrospective, 8(2), 29–40.


Ricardo Lima

Deixar um comentário