
Meu problema de gerenciamento de informações pessoais
Reuni terabytes de dados, mas tornou-se um hábito armazenar arquivos e pastas na mesma pasta. Essa pasta pode ser vista como um Inbox
local onde a maioria dos arquivos (não instalações) entra no meu sistema. Dessa forma acabo com uma grande coleção de arquivos que são difíceis de organizar adequadamente, acabo criando pastas que correspondem ao tipo de arquivo, mas ainda tenho vários gigabytes de dados por pasta, o que não o torna tão eficiente que eu pode usar a pasta de forma produtiva.
Prefiro fazer alguns cliques do que ter que pesquisar os arquivos, seja por algum produto de software ou pela pasta. Freqüentemente, os nomes dos arquivos em si não são adequados, por isso seria mais fácil reconhecê-los se houvesse poucos em uma pasta, em vez de milhares deles.
Dimensionando a estrutura de árvores de diretório em um cluster de computadoresresume esse problema da seguinte forma:
Os processos de armazenamento e recuperação de informações estão rapidamente ganhando importância na ciência e também na sociedade como um todo [1, 2, 3, 4]. Estão a ser realizados esforços consideráveis, em primeiro lugar, para caracterizar e descrever a forma como a informação disponível ao público, por exemplo, na rede mundial de computadores, é efectivamente organizada e, em segundo lugar, para conceber métodos eficientes de acesso a esta informação.
[1] RM Shiffrin e K. B¨orner, Proc. Nacional. Acad. Ciência. EUA 101, 5183 (2004).
[2] S. Lawrence, CL Giles, Nature 400, 107–109 (1999).
[3] RFI Cancho e RV Sol, Proc. R.Soc. Londres, Ser. B 268, 2261 (2001).
[4] M. Sigman e GA Cecchi, Proc. Nacional. Acad. Ciência. EUA 99, 1742 (2002).
Ele vai além explicando como os dados geralmente são organizados, analisando-os de maneira geral, mas olhando para o resumo e a conclusão, não chega a uma conclusão ou abordagem que resulte em uma organização produtiva de uma hierarquia de diretórios. Então, em essência, este é um problema para o qual ainda não encontrei uma solução; e eu adoraria ver uma solução científica para este problema.
Procurando uma solução empírica para este problema
Ao pesquisar mais, não consigo encontrar nada útil ou gratuito que aborde esse problema, então pode ser que eu esteja procurando no lugar errado. Também observei que existem diferentes maneiras de definir esse problema, o que leva a diferentes resultados de artigos. Talvez exista um artigo por aí, mas não estou apenas usando os mesmos termos que esse artigo usa? Eles costumam usar termos mais científicos.
Certa vez ouvi uma história sobre um advogado com um laptop que simplesmente superou o desempenho de um advogado com toneladas de papéis, o que mostra como uma organização adequada leva à produtividade; mas essa história não compartilhou detalhes sobre como o defensor usou o laptop ou como organizou seus dados. Mas, de qualquer forma, foi muito mais útil do que a forma como a maioria de nós organiza nossos dados hoje em dia...
Aconselhe-me como devo organizar meus dados,Não estou procurando sugestões aqui. Eu adoraria ver estatísticas ou abordagens de medição científica que me ajudassem a confirmar que isso me ajuda a alcançar meu objetivo.
A pesquisa não resolve este problema
A pesquisa não é uma solução para isso porque não permite o acesso a arquivos relevantes, o que geralmente é necessário quando você trabalha no contexto de um arquivo (que geralmente requer outros arquivos). É por isso que mencionei antes que nomes de arquivos incorretos são um grande problema. E não, colocar todos os nomes de diretório no nome do arquivo não é a abordagem correta para isso. As pesquisas em mecanismos de pesquisa de dados de texto completo funcionam apenas para arquivos textuais e os nomes dos diretórios geralmente não estão dentro do arquivo. Isso torna a Pesquisa pouco confiável e incerta ao pesquisar...
Observe também que estou procurandoestruturalorganização/acesso, porque abordagens semânticas (como "é assim que eu divido e funciona para mim e para meus amigos" ou "pesquisa funciona para mim") não são aplicáveis a todos, enquanto abordagens estruturais são aplicáveis à maioria dos usuários quenavegarseu armazenamento.
Responder1
Aqui está uma medição que fiz:
Clicar em uma estrutura de pastas muito profunda e observar até encontrar o arquivo certo.
34 segundosPressionando a tecla Windows ou Command + Espaço e digitando as palavras-chave para o nome do arquivo.
9 segundos (SSD)
A maioria dos mecanismos de pesquisa de dados modernos pesquisadentroarquivos também, então os nomes dos arquivos não são realmente uma grande preocupação. [cf OP: Nem todos os arquivos são textuais ou contêm nomes de diretório, eles não podem ser razoavelmente colocados no nome do arquivo ou no contexto de suporte]
Como uma nota rodapé:
A metodologia de organização de dados atende a dois objetivos finais [falta de prova] .
Recuperação eficiente.
TOC do usuário.
Se for o último que você terá que enfrentar, então você terá um problema. Se for a primeira opção, um bom mecanismo de busca permitirá que você atinja o objetivo tão bem ou até melhor [Prova faltante] .
Além disso, à medida que mais e mais informações são baixadas diariamente em nossas vidas, chegará um ponto em que a organização se tornará muito complicada. [Falta prova]