
Моя проблема с управлением персональной информацией
Я собрал терабайты данных, но это стало привычкой хранить файлы и папки в одной и той же папке, эта папка может рассматриваться как Inbox
место, куда попадает большинство файлов (неустановок) в моей системе. Таким образом, я получаю большую коллекцию файлов, которые трудно правильно организовать, в основном я создаю папки, которые соответствуют их типу файлов, но тогда у меня все еще есть несколько гигабайт данных в каждой папке, что не делает ее эффективной, чтобы я мог продуктивно использовать папку.
Я бы лучше сделал несколько щелчков, чем искал файлы, будь то с помощью какого-то программного продукта или просматривая папку. Часто сами имена файлов неверны, поэтому было бы легче распознать их, если бы их было несколько в папке, а не тысячи.
Масштабирование структуры деревьев каталогов в компьютерном кластеререзюмирует эту проблему следующим образом:
Процессы хранения и извлечения информации быстро приобретают все большее значение в науке, а также в обществе в целом [1, 2, 3, 4]. Значительные усилия предпринимаются, во-первых, для характеристики и описания того, как на самом деле организована общедоступная информация, например, во всемирной паутине, и, во-вторых, для разработки эффективных методов доступа к этой информации.
[1] RM Shiffrin и K. B¨orner, Proc. Natl. Acad. Sci. USA 101, 5183 (2004).
[2] S. Lawrence, CL Giles, Nature 400, 107–109 (1999).
[3] RFI Cancho и RV Sol, Proc. R. Soc. London, Ser. B 268, 2261 (2001).
[4] M. Sigman и GA Cecchi, Proc. Natl. Acad. Sci. USA 99, 1742 (2002).
Он идет дальше, объясняя, как данные обычно организованы, рассматривая их в общем, но рассматривая аннотацию и заключение, он не приходит с заключением или подходом, который приводит к продуктивной организации иерархии каталогов. Так что, по сути, это проблема, для которой я еще не нашел решения; и я бы хотел увидеть научное решение этой проблемы.
Ищем эмпирическое решение этой проблемы
При дальнейшем поиске я, похоже, не нашел ничего полезного или бесплатных статей, которые подходят к этой проблеме, так что, возможно, я ищу не в том месте. Я также заметил, что существуют разные способы обозначения этой проблемы, что приводит к разным результатам статей. Возможно, статья уже есть, но я просто не использую те же термины, что и в этой статье? Они часто используют более научные термины.
Я однажды слышал историю о защитнике с ноутбуком, который просто превзошел защитника с кучей бумаг, что показывает, как правильная организация приводит к производительности; но в этой истории не было подробностей о том, как защитник использовал ноутбук или как он организовал свои данные. Но в любом случае, это было намного полезнее, чем то, как большинство из нас организуют свои данные в наши дни...
Посоветуйте, как мне организовать свои данные,Я не ищу здесь предложений.. Мне бы хотелось увидеть статистику или научные подходы к измерению, которые помогут мне подтвердить, что это действительно помогает мне достичь моей цели.
Поиск не решает эту проблему
Поиск не является решением этой проблемы, поскольку он запрещает доступ к соответствующим файлам, что часто требуется, поскольку вы работаете в контексте файла (который часто требует других файлов). Вот почему я упоминал ранее, что плохие имена файлов являются серьезной проблемой. И нет, включение всех имен каталогов в имя файла — неправильный подход к этому. Поисковые системы полнотекстового поиска данных работают только с текстовыми файлами, а имена каталогов часто не находятся внутри файла. Это делает поиск ненадежным и неопределенным при поиске...
Также обратите внимание, что я ищуструктурныйорганизация/доступ, поскольку семантические подходы (например, «вот как я это разделяю и это работает для меня и моих друзей» или «поиск работает для меня») применимы не ко всем, в то время как структурные подходы применимы к большинству пользователей, которыенавигацияих хранение.
решение1
Вот измерение, которое я провел:
Просматривая очень глубокую структуру папок и нащупывая нужный файл.
34 секундыНажмите клавишу Windows или Command+Space и введите ключевые слова для имени файла.
9 секунд (SSD)
Большинство современных поисковых систем данных ищутвнутрифайлы тоже, поэтому имена файлов на самом деле не являются серьезной проблемой. [ср. OP: Не все файлы являются текстовыми или содержат имена каталогов, их нельзя разумно поместить в имя файла или контекст поддержки]
В качестве примечания:
Методология организации данных служит двум конечным целям [Отсутствует доказательство] .
Эффективный поиск.
ОКР пользователя.
Если вам придется бороться с последним, то у вас будут проблемы. Если с первым, то хорошая поисковая система позволит вам достичь цели так же хорошо или даже лучше [Отсутствует доказательство] .
Кроме того, поскольку в нашу жизнь ежедневно загружается все больше и больше информации, наступит момент, когда ее организация станет слишком обременительной. [Отсутствуют доказательства]