none
ファイル形式について RRS feed

  • 質問

  • いつもお世話になっております。

    現在Azure Data Factoryを導入するために検証しようと思っています。

    その際に、ファイル形式の選択をする画面が出てきます。

    以下のファイル形式はそれぞれ何の用途で使用するためのものなのでしょうか?

    1.Avro

    2.Json

    3.ORC

    4.Parquet

    例)

    バイナリ形式:

      用途:画像ファイル、音声

    お聞きしたいことは上記のような具体的な用途です。その他にも補足があると大変うれしいです。

    以上です。どなたかご教授のほどよろしくお願い致します。

    2020年4月15日 5:36

すべての返信

  • 簡単にですがまとめてみました。 各ファイルフォーマットの詳細については、個別に確認されると良いかと思います。

    Avro : 行指向フォーマット, OLTP処理に有利
    JSON : テキストフォーマット, 可視性が高い
    ORC : 列指向(カラムナ)フォーマット(バイナリ), 分析用途(Azure HDInsight(Hadoop, Sparkなど), DWH)
    Parquet : 列指向(カラムナ)フォーマット(バイナリ), 分析用途(Azure HDInsight(Hadoop, Sparkなど), DWH)

    2020年4月17日 17:36