rel="nofollow" href="#i000001090000.jpg"/>
Como os dados são tão centrais para a aprendizagem de máquina, os resultados são um reflexo direto das entradas. Se houver uma tendência nos dados, o algoritmo de aprendizagem de máquina aprenderá a ser tendencioso. Por exemplo, preditores de contratação de candidatos, recomendações de sentenças judiciais e diagnóstico médico estão todos a usar a aprendizagem de máquina e todos eles têm algum nível de tendência cultural, de genero, raça, educação ou outra tendência incorporada aos datasets que os treinam.
A tendência vai além do preconceito na coleta de dados. Às vezes, os dados enganam um algoritmo de outras maneiras. Considere o caso de um modelo militar de aprendizagem de máquina treinado para procurar tanques camuflados numa floresta. Os cientistas de dados treinaram o algoritmo num conjunto de fotos, algumas das quais com tanques nas árvores e outras com apenas árvores. Após o treino, o modelo obteve precisão quase perfeita nos testes realizados pelos cientistas de dados. No entanto, quando o modelo entrou em produção, não funcionou para identificar os tanques. Acontece que no conjunto de dados de treino, as fotos dos tanques foram tiradas num dia ensolarado, enquanto as fotos somente da floresta foram tiradas num dia nublado. O algoritmo aprendeu a identificar dias ensolarados vs. dias nublados, não tanques!
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.