Um papo sobre probabilidade subjetiva

agosto 26, 2022 § Deixe um comentário

“a probabilidade é o conceito mais importante da ciência moderna, especialmente porque ninguém tem a menor ideia do que ela significa”

O curioso da probabilidade é que a ideia que se tem dela pode ser, ao mesmo tempo, familiar e misteriosa. Familiar, porque a usamos “a torto e a direito”, seja como sinônimo de possibilidade ou chance de algo acontecer (e.g., qual a probabilidade de chover amanhã?), seja como ferramenta aplicada (e.g., o cálculo da probabilidade do time P ou F de ganhar o campeonato B). Misteriosa, porque quando se pede para defini-la, normalmente se tem certa dificuldade. Há uma frase atribuída a Bertrand Russell que explicita essa dualidade. É mais ou menos assim: “a probabilidade é o conceito mais importante da ciência moderna, especialmente porque ninguém tem a menor ideia do que ela significa”

A questão do mistério que a envolve, na minha opinião, está muito ligada ao modo como o conceito é introduzido: usa-se um dispositivo aleatório de maneira ilustrativa (na maioria das vezes, um dado). Normalmente é dito que a probabilidade de um evento (e.g., jogar um dado e sair o número 6) é a frequência média em que esse evento será observado se usarmos esse dispositivo repetidamente. De forma que, a probabilidade de se obter um 6 em um dado não-viciado (o termo é importante para garantir que o resultado depende do acaso) é 1/6, porque se você jogar um dado muitas vezes, em média, observará o número “6” uma vez em seis. É a chamada definição frequentista.

Leia o texto completo em Update or Die. Publicado em 25 de agosto de 2022.

Computação quântica 101: Algoritmos quânticos e complexidade computacional

agosto 1, 2022 § Deixe um comentário

Um problema computacional é todo e qualquer problema que possa ser resolvido por meio de algoritmos.

Central Computer Processor digital technology and innovations

Este texto faz parte de uma série em andamento sobre computação quântica. Os textos anteriores podem ser acessados pelos links numerados: 123 e 4.

Em teoria da computação, um problema computacional é todo e qualquer problema que possa ser resolvido por meio de algoritmos. São problemas ligados a processos de decisão, à busca, à otimização, etc. Abarca desde questões como “o número 123.456.789.001 é primo?” (no caso, não é) até problemas mais complexos, conhecidos como problemas de função, como: “dada uma lista de cidades e as distâncias entre cada par de cidades, encontre a rota mais curta possível que visite cada cidade exatamente uma vez e retorne à cidade de origem.”  (o famoso problema do caixeiro-viajante). Esses problemas são costumeiramente divididos em classes de complexidade computacional.

Leia o texto completo em Update or Die. Publicado em 28 de julho de 2022.

The Impact of Non-Verbalization in Think-Aloud: Understanding Knowledge Gain Indicators Considering Think-Aloud Web Searches

junho 29, 2022 § Deixe um comentário

Marcelo Tibau, Sean Wolfgand Matsui Siqueira, and Bernardo Pereira Nunes. 2022. The Impact of Non-Verbalization in Think-Aloud: Understanding Knowledge Gain Indicators Considering Think-Aloud Web Searches. In Proceedings of the 33rd ACM Conference on Hypertext and Social Media (HT ’22). Association for Computing Machinery, New York, NY, USA, 107–120. https://doi.org/10.1145/3511095.3531272

Abstract: Web searching and knowledge gain are intertwined processes that share mental and physical activities at the core of both human cognition and hypertext theory, such as identifying, comparing, linking, and combining different subsets of existing or new information. As a consequence of the improvement of our ability to retrieve information across multiple sources provided by Web search engines, the necessity to understand how a user’s knowledge evolves through a Web search session increased. Previous works focused on understanding the knowledge gained in Web searches by using think-aloud protocols. From the user’s verbalization of her searching procedures, it is possible to identify her cognitive processing. Notwithstanding, we argue that user’s searching and browsing behaviors should be analyzed not only through the verbalization periods, as usually accepted by think-aloud studies, since not all cognitive decisions are made consciously, some are unconscious or subconscious. Hence, it is possible to identify more knowledge gained than it would be attainable focusing solely on what was verbalized. In this sense, we evaluated the statistical significance level derived from the relationship between verbal and non-verbal search periods mapped from online information searching strategy indicators. Then, we identified a positive association regarding non-verbalization and some indicators related to knowledge gain concepts and discovered that the values of non-verbal periods tend to increase as the values of particular indicators related to knowledge gain also increase. The knowledge gain concepts were identified using constructs representing cognitive absorption, comprehension, elaboration, and memory. Concerning the impact of Think-Aloud on knowledge gain processes, we found out that verbalization does affect how participants handle their search tasks. However, our result also showed a predominance of non-verbal periods during metacognitive-based searching activities, which may indicate that Think-Aloud protocols should not only rely on verbalization for indication of knowledge gain. Although verbalization may not disrupt the thought process, it might cut in on the cognitive process as the participant tries to explain her action while performing it. A search engine could use the identified indicators to account for the knowledge gained during search sessions, which would make it more adapted to identify user information needs and promote personalized information-adding.

Precisamos falar sobre LaMDA, a IA que o engenheiro do Google achou que havia adquirido autoconsciência

junho 24, 2022 § Deixe um comentário

Quem trabalha com IA já está acostumado com o tipo de interação que um modelo muito sofisticado é capaz de apresentar. Também está acostumado com alegações de autoconsciência, como no caso do LaMDA.

Por alguns dias neste mês de junho de 2022 surgiu como trend topic, quase que do nada, um debate sobre Inteligências Artificiais auto-conscientes. Quase que do nada é uma figura de linguagem minha, porque a controvérsia surgiu sim de algo.

Por volta do dia 11, Blake Lemoine, engenheiro da Google, publicou dois posts [1, 2] a respeito do sistema LaMDA (pronuncia-se “lambda”, como a décima primeira letra do alfabeto grego). Os posts foram meio que uma resposta ao artigo publicado no jornal The Washington Post [3], relatando que apesar do departamento ético da companhia ter recomendado que não se treinasse uma rede neural para “personificar” seres-humanos, a empresa o fez (o sistema LaMDA) e que um de seus funcionários (o próprio Blake Lemoine) acreditava que o sistema havia adquirido autoconsciência.

Lemoine contava em seus posts os motivos que o levaram a acreditar na emergência da autoconsciência e para provar seu ponto, compartilhou transcrições de “conversas” que teve com LaMDA. A Google imediatamente rebateu as alegações, acusou Lemoine de compartilhar informações proprietárias da empresa e o colocou em “paid administrative leave”, que basicamente é o primeiro passo para a demissão (é o nosso famoso “afastado das suas funções”).

Leia o texto completo em Update or Die. Publicado em 23 de junho de 2022.

Sobre quando teremos uma IA de nível humano

maio 6, 2022 § Deixe um comentário

Probabilidade de 10% até 2031, de 50% até 2052 e de quase 80% até 2100.

Open Philanthropy Project (“Open Phil”) é uma fundação interessada em financiar estudos de segurança em IA. Possui cerca de US$ 20 bilhões disponíveis para identificar oportunidades, financiar, acompanhar os resultados e publicar as descobertas. Em 2020, pediu à sua pesquisadora sênior Ajeya Cotra que produzisse um relatório preditivo que pudesse estimar quando a IA atingiria níveis humanos. Ajeya compartilhou comigo um Google Drive com o seu relatório e os modelos usados para a predição e gentilmente permitiu que divulgasse o material. 

Leia o texto completo em Update or Die. Publicado em 06 de maio de 2022.

Uma transformação profunda na IA

abril 1, 2022 § Deixe um comentário

Neste exato momento, há uma cascada informacional acontecendo no meio da Inteligência Artificial, mais especificamente com quem trabalha com redes neurais, como eu.

Há um fenômeno estudado em teoria das redes chamado cascada informacional [1]. Essa cascada se inicia quando mais e mais pessoas, racionalmente, prestam cada vez mais atenção aos sinais informativos transmitidos pelas declarações e ações de outros. Como resultado, amplificamos o volume dos próprios sinais aos quais fomos inicialmente expostos e posteriormente influenciados. Movimentos sociais de vários tipos, incluindo modismos, tendências e rebeliões (e.g., Beatlemania, Primavera Árabe, #MeToo e BBB) podem ser entendidos como um produto dos efeitos da cascada informacional.

Neste exato momento, há uma cascada informacional acontecendo no meio da Inteligência Artificial, mais especificamente com quem trabalha com redes neurais, como eu. O nome da nossa “Beatlemania” se chama Transformers.

Leia o texto completo em Update or Die. Publicado em 01 de abril de 2022.

Computação quântica 101: Quantum gates

março 3, 2022 § Deixe um comentário

Para processar informações, é necessário que um computador tenha a possibilidade de modificar seus bits (caso contrário a máquina não teria lá muita utilidade). Para tal, são usados circuitos computacionais.

Os circuitos dos computadores clássicos consistem em semicondutores e portas lógicas. Os semicondutores são usados para transportar informações pelo circuito, enquanto as portas lógicas realizam manipulações das informações, convertendo os sinais digitais provenientes de suas entradas [1]. Na computação clássica, uma porta implementa operações binárias em entradas binárias, transformando zeros em uns e vice-versa [2]. 

Para exemplificar a ação da porta lógica, peguemos portas de entrada únicas, que podem receber uma entrada (0 ou 1) e fornecer uma saída (0 ou 1). De uma maneira geral, portas lógicas são definidas por tabelas verdade. A tabela verdade corresponde às saídas de um sistema para todas as combinações de entrada. Uma porta de entrada única que recebe um 0 como entrada e produz um 0 como saída, ou recebe um 1 e produz um 1, não realiza nada – poderia muito bem não estar no circuito. Esse tipo de operação que não produz um resultado, é chamada de trivial. Uma porta que recebe um 0 como entrada e produz um 1, ou recebe um 1 e produz um 0 pode ser útil em um circuito. Neste caso, dizemos que realiza operações não triviais. No exemplo de portas de entrada únicas, somente há uma operação lógica de Cbit não trivial, a operação NOT, que leva de 0 a 1 e de 1 a 0. 

Leia o texto completo em Update or Die. Publicada em 03 de março de 2022.

Technical Report: A Systematic Mapping Study on Search Engine Industry’s Patent Innovations Focused on Matching the Search Results to User Intent

fevereiro 1, 2022 § Deixe um comentário

Tibau, M., Wolfgand Matsui Siqueira, S. ., S. N. Nunes, M. A., & Pereira Nunes, B. . (2022). A Systematic Mapping Study on Search Engine Industry’s Patent Innovations Focused on Matching the Search Results to User IntentRelaTe-DIA15(1).

URI: http://www.seer.unirio.br/monografiasppgi/article/view/11673

Abstract: This report presents a systematic mapping study to survey patent documents in Brazilian and international databases to characterize the technical state-of-the-art in search engines under the intent matching paradigm as well as to discover the size of academia initiatives as part of the technical state-of-the-art agenda to commercial innovation ventures in the search engine industry. The goal is achieved by the identification of the search engine industry most common innovation claims concerning the intent matching paradigm and by the discussion of important issues regarding its patent application patterns, such as the search engine industry’s proficiency to churn its innovative landscape.

O segundo relatório do estudo de cem anos sobre Inteligência Artificial (AI100)

janeiro 24, 2022 § Deixe um comentário

Em setembro de 2021 foi finalmente publicado o segundo relatório do estudo de cem anos sobre Inteligência Artificial (AI100), intitulado “Gathering Strength, Gathering Storms”.

Uma rápida recapitulação do que se trata: em 2014 foi lançado o “Estudo de 100 anos para a Inteligência Artificial”, por uma espécie de consórcio formado por universidades e departamentos de pesquisa de empresas de tecnologia.

Em 2016 foi publicado o primeiro relatório, que comentei extensamente neste espaço à época (foram cinco textos no total, deixo o link do último deles, onde você pode achar links para os demais). Uma das críticas ao primeiro relatório (de 2016), enfoca o fato dele ter restrito seu escopo apenas a cidades da América do Norte.

O relatório de 2021 é mais abrangente, mas apesar da intenção declarada de “explorar com maior profundidade o impacto que a IA está causando nas pessoas e sociedades em todo o mundo” [1], ainda se vê uma prevalência de membros participantes vindos de universidades americanas, canadenses e de língua inglesa (Escócia e Austrália, mais especificamente).

Leia o texto completo em Update or Die. Publicada em 21 de janeiro de 2022.

Mapping Knowledge Flows in Exploratory Web Searches

janeiro 6, 2022 § Deixe um comentário

Abstract: This paper provides an understanding of the knowledge flow in exploratory Web searches. Based on the Design Science Research epistemology, we represented the information-gathering behaviour and uncovered the knowledge flow of Web searchers as a Knowledge-intensive Process (KiP). By mapping searchers’ steps and paths during Web searches, representing their search patterns and decision-making process, it was possible to reveal the knowledge flow and infer the resources more likely to be selected to meet the searchers’ information needs. With the help of six teachers, we applied the Think-Aloud method in a scenario where they searched for online (educational) resources on the Web. The application of the Think-Aloud method made knowledge-flow processes explicit throughout Web searches. The results can support new strategies for information retrieval systems and be applied to support expertise exchange and innovation.

Access: http://hdl.handle.net/10125/80007

ISBN: 978-0-9981331-5-7

Rights: Attribution-NonCommercial-NoDerivatives 4.0 International

https://creativecommons.org/licenses/by-nc-nd/4.0/

Onde estou?

Você está navegando atualmente a Educação categoria em Marcelo Tibau.