Construir um serviço de análise da web sem cookies apresenta um problema complicado: como você distingue visitantes únicos?
Como você distingue visitas únicas sem usar cookies?
Para a maioria das soluções baseadas em cookies, é fácil: armazene um identificador exclusivo (UID) em um cookie em seu computador, para que possamos identificá-lo quando você retornar. Mas se não houver cookie, não há UID … ou assim você pensaria.
Muitos serviços analíticos com foco na privacidade irão gerar e armazenar um UID no servidor em vez de salvá-lo em um cookie – com base em um hash de seu agente de usuário, IP, local, data etc. Essa “impressão digital” é armazenada em um banco de dados e verificada toda vez que você visita o site para ver se você já o visitou antes. Para melhorar a privacidade, ele pode ser removido do banco de dados assim que cumprir sua finalidade, por exemplo, diariamente. Alguns serviços de análise simplesmente dependem do referenciador da página estar no mesmo domínio que seu URL atual.
Questões de privacidade
Experimentos anteriores da Normalmente revelaram que vincular pontos de dados em um banco de dados de qualquer forma, como com um UID, tem o potencial de revelar a identidade de alguém. Conectar apenas alguns pontos de dados, como cidade, horário e páginas visitadas, pode nos dizer mais do que precisamos saber sobre esse visitante e, às vezes, levar à sua identificação no mundo real.
Ao construir Cabin, não queríamos usar UIDs de forma alguma, e o referenciador não era confiável em todos os navegadores (alguns navegadores e extensões podem ocultá-lo). Então, criamos uma abordagem diferente.
A solução
Nossa solução não requer um banco de dados ou qualquer coisa armazenada no lado do servidor. Funciona até nos navegadores mais antigos. Veja como:
Quando o navegador faz ping em nosso servidor de um site pela primeira vez, enviamos de volta uma resposta com um cabeçalho definido como Cache-Control: no-cache
, informando ao navegador para armazenar a solicitação em seu cache, mas revalidá-la com o servidor de origem antes de cada uso. Mas o mais importante, enviamos um cabeçalho que é uma data definida para o início de cada dia:
last-modified: Wed, 30 Nov 2022 00:00:00 GMT
A partir de agora, toda vez que essa requisição for feita novamente, o servidor recebe a data e ajusta em um segundo , e retorna para o navegador:
last-modified: Wed, 30 Nov 2022 00:00:01 GMT
Desta forma, o servidor pode calcular a distância em segundos desde a meia-noite para nos dar uma contagem de visitas.A contagem de visitas é codificada
na data armazenada na solicitação armazenada em cache na máquina do visitante.
Veja isso em ação aqui 👉 demo
Contando saltos também
Uma rejeição é quando um visitante acessa sua página e sai dessa mesma página sem visitar outra página em seu site. Podemos distinguir visitantes únicos (um vazio last-modified
), mas também podemos aproveitar nosso contador para somar rejeições durante o dia, assumindo que uma visita única é uma rejeição até recebermos a segunda solicitação. As solicitações a seguir são ignoradas.
Primeira visita:
visitas únicas rejeições +1 +1 +1
Segunda visita:
visitas únicas rejeições +1 0 -1
Visitas subsequentes:
visitas únicas rejeições +1 0 0
Conclusão
Embora esses cabeçalhos não sejam destinados a isso, estamos apenas atualizando e observando-os no servidor de acordo com os padrões do navegador.
Isso é ótimo para privacidade , pois não precisamos usar cookies, endereços IP, impressões digitais ou identificadores exclusivos. Em nossos testes, esse método provou ser durável o suficiente para ser o método mais confiável de contagem de visitantes únicos sem o uso de cookies.
Usamos esse método no Cabin, nossa análise da web com privacidade em primeiro lugar e consciência de carbono. Cabin também está em conformidade com todas as leis de privacidade. É simples, leve e permite que você rastreie as emissões de carbono em seu site. É uma ótima alternativa ao Google Analytics. Inscreva-se para uma conta gratuita para vê-lo em ação.