DBから抽出したウィキペディアの文章からウィキ記法を排除する

$text = preg_replace("/[^\\n\-\=  ()『』・、。ぁ-ゞァ-ヶーア-ン゙゚ァ-ォャ-ョーa-zA-Z0-9\p{Han}]+/u", "", $wikitext);

変数の$wikitextにウィキ記法で書かれた文章が入っているものとします。

他にもやりようはあるとは思いますが、preg_replaceで必要なもの以外を削除します。

ウィキ記法をパースするライブラリはいくつか存在しますが、ここはひとつシンプルに捉えて、ベーシック方法で行います。

先頭に^(カレット)が付いているので、それ以降に記述されているもの以外を削除します。

<?php

$wikitext = <<< BDF
『'''007 サンダーボール作成'''』(ゼロゼロセブン サンダーボールさくせん、"Thunderball")は、
[[イアン・フレミング]]、ケヴィン・マクローリー、ジャック・ウィッティンガムの長編小説『007』シリーズ第8作。また[[1965年]]公開、[[テレンス・ヤング]]監督の[[アクション映画]]。[[ジェームズ・ボンド|『007』シリーズ]]第4作。
== 小説 ==
『007』シリーズ長編第8作(単行本としては『007号の冒険』に次ぐ9冊め)。フレミング自身の手による最初で最後の[[ノベライゼーション]]。[[ジョナサン・ケーブ]]より出版された。
BDF;

echo $wikitext;

// 必要なもの以外を削除
$text = preg_replace("/[^\\n\-\=  ()『』・、。ぁ-ゞァ-ヶーア-ン゙゚ァ-ォャ-ョーa-zA-Z0-9\p{Han}]+/u", "", $wikitext);

echo "<p>".$text."</p>";

/* 結果
『007 サンダーボール作成』(ゼロゼロセブン サンダーボールさくせん、Thunderball)は、 イアン・フレミング、ケヴィン・マクローリー、ジャック・ウィッティンガムの長編小説『007』シリーズ第8作。また1965年公開、テレンス・ヤング監督のアクション映画。ジェームズ・ボンド『007』シリーズ第4作。 == 小説 == 『007』シリーズ長編第8作(単行本としては『007号の冒険』に次ぐ9冊め)。フレミング自身の手による最初で最後のノベライゼーション。ジョナサン・ケーブより出版された。
*/

?>

preg_replaceで不要なものを列挙するのではなく、先頭に「^」を付け、記述したもの以外を削除する方法です。