トップページ > プログラム > 2019年01月12日 > 1w+JfQLL

書き込み順位&時間帯一覧

5 位/150 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000000000000130001005



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
くだすれPython(超初心者用) その40

書き込みレス一覧

くだすれPython(超初心者用) その40
698 :デフォルトの名無しさん[sage]:2019/01/12(土) 16:45:16.85 ID:1w+JfQLL
>>697
状況がよく分からないので適切なアドバイスは難しいけど、rowに日付、colに属性はよくある実装

colにインスタンス変数を、という表現は聞きなれない言い回しなので、何のことだか戸惑った
くだすれPython(超初心者用) その40
700 :デフォルトの名無しさん[sage]:2019/01/12(土) 17:05:45.50 ID:1w+JfQLL
>>699
記録することと、記録されたものをどう使うかは分けて考えないとダメだよ

例えばセンサーから温度と湿度の出力があるとする

これを一旦csvに落として、一列目に日付を、二列目に温度、三列目に湿度を入れるのはおかしい事ですか?と聞かれたら、全くおかしくない、普通です

csvに落とさず、インスタンス作って管理するけどおかしい?と聞かれたら、まあ、いいんじゃないと答える

csvに落とさず、インスタンス作って管理するけど、rowをインスタンスに、colに温度と湿度いれるのはおかしい?と言われたら、え?何したいの?O/Rマッパ?シリアライズ?それとも2次元のリストにインスタンス突っ込むの?え?え?となる
くだすれPython(超初心者用) その40
702 :デフォルトの名無しさん[sage]:2019/01/12(土) 17:21:10.85 ID:1w+JfQLL
>>701
高負荷かけてボトルネックを調査しよう
ハードウェア、ソフトウェア、ネットワーク、どこに問題があるのか
ハードウェアならCPU、メモリ、OS、ディスクIO、仮装環境プラットフォーム等
ソフトウェアはライブラリの実装
ネットワークはping打つなど
何十並列のときに重いならロードバランサ入れるとか

それだけシンプルなコードで速度上げるってのもかなりの難題だね
くだすれPython(超初心者用) その40
704 :デフォルトの名無しさん[sage]:2019/01/12(土) 17:43:31.66 ID:1w+JfQLL
>>703
センサーの記録はセンサー単位で生データを記録する方がいいよ
加工しながら記録すると集める部分にバグがあったときに古いデータが全損になる

保存されたデータを後からマージ処理をする手間は発生する
複数のセンサーのサンプリングタイミングは同じとは限らないので時間でリサンプリングすることになる
サイズが大きいならRDB使うし、小さくて良いならpandasをつかう

リアルタイム性が必要な場合は、後解析用に記録するプログラムと、リアルタイム処理で分離する
くだすれPython(超初心者用) その40
706 :デフォルトの名無しさん[sage]:2019/01/12(土) 21:16:37.02 ID:1w+JfQLL
>>705
規模にもよるけど最近はPCの性能が上がっているので大抵のことはpandasで足りることが多いです
リサンプリングもpythonで一行
データフレームのマージも一行

RDBを使うときは割と明確で、ウェブサービスと連携させたいか、並列処理で更新と読み込みが同時に発生して排他処理をする必要がある場合
この二つのケースに該当するときは規模に関わらずRDBを使うとトラブルが少ないです

参考ページはよく分かりませんが、RDBの初心者だとすると、まずpandasが良いかも知れません


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。