プログラムのアーカイブ


htmlsql スクレイピング 実装する前に googleで検索です

スクレイピング scraping とは?
 「削る」という意味。Webページの中から情報を「削り取る」。Webページからスクリプトなどを使って必要と思う情報だけを取ってくること。

プログラムにとりかかる前に、さくっと検索してみました。情報を提供してくださっている方々に感謝です。

何が出来るのか? どの場面で使うのか? きっちりと仕様を決めるまではgoogle検索で情報を取得して、コツコツと動作検証をすることになります。

参考URL
 スクレイピングとは
 Webサイトへのログイン作業を簡単にする自動化ツールを作ろう
 Web サービスと Ajax を使ってデータ入力を自動化する
 ソフトウェアテスト自動化まとめサイト なんでも自動化サイト
 phpによるスクレイピング処理入門
 Webスクレイピングを可能にするPHPライブラリ・htmlSQL
 スクレイピングならHTMLScraping→SimpleXML→xpath
 PHPでスクレイピングしてみる 
 PHPでHTMLをパーサーにかけてスクレイピング
 PHP+tidy+XMLでスクレイピング


真面目にエロサイトを作ってみた【プログラマ編】

キーワード: スクレイピング, htmlsql

[ htmlSQL ] SQL みたいな文法で HTML を抽出する PHP のライブラリ
 htmlSQLのサンプル source

htmlSQLよりアツい!?jQueryみたいにセレクタでHTMLをparse(解析)する「PHP Simple HTML DOM Parser」


独学のプログラムでエロ動画検索を作ってみた!(7)

phpによるスクレイピング処理入門

PHP Simple HTML DOM Parser が良いらしぃ。

2011年12月22日 |

カテゴリー:プログラム

PHPExcel か excel_reviser か? それとも PDFlibで

データベースから、データを抽出しオンザフライで綺麗なレイアウトで出力したいという事だったので、PDFで出力するか?excelで出力するか検討してみた。

出力した帳票を部分的に変更したくなる。 という事は日常茶飯事なのでPDFで出力すると後々、大変になりそうな予感。
商売モードだったら、フォーム変更料を請求出来るので、PDF出力もあり…かもしれないが、普段お世話になりっぱなしのお客様の案件なので使いやすさを考慮してexcel形式で出力する予定。

PHPExcelとReviserの比較(前編)
PHPExcelとReviserの比較(後編)
PHPでExcelを操作する方法
excel_reviserの文字化け解消

月曜日の朝までに仕上げられればいいな。

pogodrive-Buffalo-2012-02-workとkuro-(programs)に保存。

2011年9月23日 |

カテゴリー:Linux プログラム

mysql データの存在チェック

//データ存在確認
function checkExistData($tablename)
{
        $sql_exist = "select * from " . $tablename . ";";
        $rs_exist = mysql_query($sql_exist);
        $num = mysql_num_rows($rs_exist);
        return $num;
}

2011年7月9日 |

カテゴリー:プログラム

重複しない乱数をある範囲内で必要なだけ取得するには?

   1.  <?php
   2.  $rand_ar = range($min , $max);
   3.  //range()を使い$min から $max までの整数を値に持つ配列を$rand_arに取得
   4.  
   5.  shuffle($rand_ar);
   6.  //shuffle()を使い$rand_arの並びをランダムにする
   7.  
   8.  // $rand_ar[0]から$rand_ar[$num]には重複しない整数がランダムな順番で入っているので
   9.  // 先頭から順番に好きなだけ取得することでランダムな整数を必要なだけ取得できる
  10.  ?>

PHPで重複しない(かぶらない)ランダムな整数というかつまりは乱数を取得する 感謝です。

2011年7月6日 |

カテゴリー:プログラム

grep 指定したパターンを含むファイル名だけを表示

grep option pattern filename

-l (エル): 指定したパターンを含むファイル名だけを表示する。

該当するファイルを削除するシェルスクリプト

#!/bin/sh

x=`grep -l hoge filename*.html`
rm -f $x

で解決かも。

2011年6月30日 |

カテゴリー:プログラム

現在このHPは作成途中です。
有益な情報を提供したい。
そんな思いで書いていますが、 まだまだ力不足です。
どうぞよろしく。