View
1.509
Download
2
Category
Preview:
DESCRIPTION
GUIベースの統計パッケージって、データ数多くなったら動作が重くて使い物にならなくなりませんか? SASで快適な分析ライフを!
Citation preview
SAS University Editionを使おう
(インストール編)Mac版、 Linux版もありますが、ここではWin/VM Ware版に特化して説明します
SAS University Editionって? SAS:定番の統計解析パッケージ
大型コンピュータしかない時代からある 定評があるソフトなので、計算結果が信頼できる
Excelの分析ツールは・・・ University Edition:大学関係者向け・無料
サイトライセンス系のように VPNで大学に繋ぐ必要なし
大学をやめても利用可能 大学向けとあるが、非営利なら特にうるさく言われない
計算はちょっと遅い(否・動作が重い←ココが重要) 自分の PC内に HTTP鯖を立ててブラウザ経由で実行 オーバーヘッドがかなりある
SASのいいところ: CUIベース 慣れるまで少し敷居があるが、慣れるとすごく楽! 加えて、「かゆいところに手が届く」感がすごくある
分析用の(簡単な)プログラムを書いて実行する データ数が大きくなっても重くならない:数万データでも平気
Sピー SSのように GUI操作でもたつかない 類似の作業はプログラムの再利用・コピペが可能
GUIのように毎回所定の場所をクリック・・・不要 変数を少しずつ変えて重回帰→簡単! 別データで類似分析→簡単
データのフォーマットが一括指定可能 Sピー SSのように個別に入力しなくていい
必要スペック:ちょっと高め メモリ:多め推奨(出来れば 4GB以上)
SASを動かすだけだとそこまで要らないが 同時にWordや Excel、 PowerPointも動かしますよね?
64ビット OSを推奨: 32ビットだとメモリ上限 3GBなため
CPU:速いほうがいい Corei5のノートでの体感速度が「小山が院生時代に
MMX Pentiumマシンで SASを動かしていたぐらい」 ・・・と言ってもわからないかな? 計算でちょっと待たされるので、速いマシンの方がいいでしょう
使えるようになるまで(1) SAS University Editionでググってページを見つける http://
www.sas.com/en_us/software/university-edition.html にアクセスすれば OK
How to Download SAS® University Editionに従う 仮想化システム: VM Ware Playerを DL&インスコ
別にもう一つの方でもいいですが、私はこっちに慣れてるので・・・
当然、もう PC内にあれば不要 VMware 用の SAS® University Edition を DL 1.5GB(解凍したら 3G超)なので、時間と容量に注意
DLした ZIPファイルを解凍 10分程度はかかるので注意
使えるようになるまで(2) 解凍したフォルダ名を
SASUniversityEditionに変更,その下にmyfoldersというフォルダを作成
VMWare Playerへの登録 VMWare Playerを起動1. 仮想マシンを開く→解凍したフォルダを指定
2. SAS University Editionというファイルが一つだけ見えてるのでそれを選択
3. SAS-University-Editionが出れば OK
1
2
3
使えるようになるまで(3) 共有フォルダを指定
1. SAS-University-Editionの文字を右クリック→設定
2. 仮想マシン設定画面でオプションのタブをクリックし、共有フォルダをクリック
3. フォルダの共有を常に有効にし、フォルダの追加を選択
4. フォルダ選択ウィザードが出るので次へをクリック
5. フォルダの指定を要求されるので、 さっきのmyfoldersを指定
1
3
5
VMWare Playerを起動 仮想マシンを開く→解凍したフォルダを指定
SAS University Editionというファイルが一つだけ見えてるのでそれを選択
次回以降は左側のメニューに登録されるので、そこから選べばOK
使えるようになるまで(4) 初起動時のみ
toolsを DLしろ→素直に Yes その後はそのまま放置
これまた結構時間がかかる 起動途中:右上 完全に起動後:右下
画面に出る IPアドレスが重要 今回の例: 192.168.218.128
終了時 Player→パワー→シャットダウン
絶対にウィンドウをいきなり閉じないこと!
使い方 ブラウザにさっきの IPアド
レスを入力 原理上は LAN内のどのマシンでも OKなはずなので、早いデスクトップを使うのもいいかもしれない
ようこそ画面(右上)が出るので、 SAS Studioを始めるをクリック→右下画面に たまに更新があるかもしれない
あとはテキトーに使える・・・が、次スライド以降で少し補足
データフォルダについて 共有フォルダとして作った
myfolders( SAS上ではマイフォルダと表記)の下のフォルダは全て認識される
myfoldersの下にフォルダを作り、分析で使うデータ&SASプログラムを全て保管する
右例:マイフォルダの下にyauctionと言うフォルダを作り、 data1.csvというファイルを格納 一連の作業はWindows上で行う
SASプログラムについて データと同様に、フォルダ無いに
置けば存在は認識 SASプログラムをWindowsでエディタで書いて OK
中身は自動更新されないことに注意 Windows上で書いたものを反映させるには更新が必要
更新させたいとき1. 右ウィンドウの SASプログラムの
横の ×をクリックして消す2. 左ウィンドウから SASプログラムを指定して読み込む
1
2
SASプログラムでのフォルダ指定と実行 今回の例だと・・・
/folders/myfolders/yauction/data1.csv SASプログラム上ではこう書いています
infile "/folders/myfolders/yauction/data1.csv" ファイルは全て /folders/myfolders/ の下に入ることに注意
実行は人が入ってるアイコンをクリック
サンプルプログラム・・・のようなもの 発表スライドはこちら
http://www.slideshare.net/yuhsukek/digraj2014
DiGRAJ 夏期研究大会 2014で使ったヤフオクデータを読み込む→ちゃんと読めたか打ち出すだけのプログラム
いくつかおまじない DLM=‘,’
データ区切りがカンマ firstobs=2
データは 2行目から
DATA test;
infile "/folders/myfolders/yauction/data1.csv"
DLM=',' firstobs=2;
input hprice nbid ptime sprice extend post;
proc print;
run;
こうなります 右:実行結果
エラーがある場合にはログを見て直すこと
これ以上は今回の範囲を超えるので、ここまでにしたいと思います
Recommended