orleanz: (main)
orleanz ([personal profile] orleanz) wrote2016-02-25 09:54 am

Вопрос программистам: что быстрее - файловая система или база данных?

Уточняю вопрос (иначе он был бы бессмысленным)

Допустим, у нас есть 1 (одна) таблица с 2 (двумя) колонками

В первой колонке - большой интегер, Юникс тайм, отсортированный по возрастанию, во второй колонке - строки (собственно пейлоуд, данные)

Я хочу максимально быстро выдавать те строки таблицы, которые удолетворяют некому условию по первой колонке, например, все строки соответствующие одному дню

Это элементарно делается с использования условного Постгреса, ок.

Но ведь можно создать на файловой системе набор файлов, для каждого дня, где содержимое файла и будет набор строк с пейлоудом. И отдавать данные путем просто открытия файла с нужным именем (которое совпадает с днем, например, 2010.10.31.txt) и чтением данных из файла. Там и кэширование автомически появится, на уровне файловой системе, типа, бесплатный бонус.

Что будет в результате быстрее, как думаете?

Вопрос апдейта данных и сложных запросов не стоит, речь про узкоспециализированную задачу, описанную выше.

Тут ведь еще какой момент есть - если речь идет про веб, то выдача данных может идти НАПРЯМУЮ через стоящий впереди реверс-прокси Nginx, через статическую директорию. То есть просто по прямому УРЛ обращаешься к файлу с соответствующим именем, скажем, http://mysite.com/static/db/2010.10.31.txt, и усё, Энджинэкс выдаст данные даже не потревожив Ноду (аппликейшен сервер). А если делать через базу данных, то аппликейшен сервер будет по всякому задействован...

[identity profile] orleanz.livejournal.com 2016-02-25 11:18 am (UTC)(link)
" Угу. Так и хочется добавить в имя ../../../ и выйти на новый уровень.

nginx не позволит, там прописана публичная папка, и за ее пределы хрен выйдешь

[identity profile] orleanz.livejournal.com 2016-02-25 03:05 pm (UTC)(link)
предложенный тобой "вариат взлома" не имеет никакого отношения описанной задаче, он "ломает" вообще любой вебсервер, не важно с базой или без базы.

то что вебсервера имеют статические папки - это абсолютный стандарт современного веба. В этих папках лежат ресурсы, которые должны быть бысто отдаваться клиенту и которые не содержат секрета, потому что они и так видны в браузере (в частности, картинки, стили и джаваскрипты).

если ты научился ломать защиту nginx или апача предложенным образом - поздравляю, ты сломал 99% всех вебсайтов мира.

иными словами, это как сказать - ваш вебсервере работает на виндоус или юникс ? а вот список серьюрити проблем этих ОС, ай-ай-ай. Возникает законный вопрос -ок, виндоус и юникс низзя для сервера, а что МОЖНО? Мейнфрейм ? Ну, ок.






Edited 2016-02-25 15:08 (UTC)

[identity profile] vit-r.livejournal.com 2016-02-25 03:36 pm (UTC)(link)
Есть правило: для безопасности запрещено должно быть всё, что не разрешено. В этом смысле любой доступ к чему-то на диске - зло.

[identity profile] orleanz.livejournal.com 2016-02-26 08:24 am (UTC)(link)
то есть если на вебсайте CIA (ЦРУ) показан логотип этой организации, который отдается вебсервером через статическую папку, как это обычно бывает с картинками - это потому, что ЦРУ не знает как организовать безопасность?

[identity profile] vit-r.livejournal.com 2016-02-26 08:26 am (UTC)(link)
ЦРУ - это государственная контора. Там чиновники. Фиг знает, как и у кого одни заказывали веб-страницу.