数億件のレコードを保存

Question 1

そのサイズのデータセットに関する私の経験は MSSQL に限られていますが、そのサイズのデータは間違いなく処理できます。

まず気になるのは、データのサイズです。150GB の 3 億件のレコードは、1 行あたり約 500KB で、これは大きな行です。非常に大きな行です。第 3 正規形に正規化できれば、これは劇的に役立ちます (正規化できるデータがあると仮定した場合)。正規化しない場合 (単一の巨大なテーブルのみの場合)、ISAM をサポートするエンジンは RDBMS よりも高速になるため、ISAM モードの MySQL は MSSQL よりも明らかに優れています (申し訳ありませんが、Postgre や Mongo の経験はありません)。

とはいえ、MSSQL はそのようなサイズのテーブルを問題なく処理できます。MSSQL はデータを分割して、異なる部分を異なるディスクに保存できるため、予算が問題であれば、更新されたデータの 1% を高速ディスクに保存し、残りを低速ディスクに保存することができます。選択した DBMS がこれをサポートしている場合は、これが賢明な方法かもしれません。

参考までに、私はかつて、1 つのテーブルに約 2 億行 (ただし、テーブルのサイズは 20 GB のみ) を持つデータベースを管理していましたが、スマートなインデックス作成により、クエリ時間は依然としてミリ秒単位で計測されていました。これは第 3 正規形に正規化されていたため、関連データを取得するための LOJ も多数ありました。

Answer