Channel: C#タグが付けられた新着記事 - Qiita

X Mark channel Not-Safe-For-Work? cancel confirm NSFW Votes: (0 votes)

X Are you the publisher? Claim or contact us about this channel.

X 0

Showing article 521 of 9541 in channel 75726148
Channel Details:

Title: C#タグが付けられた新着記事 - Qiita
Channel Number: 75726148
Language: Japanese
Registered On: November 2, 2019, 9:06 am
Number of Articles: 9541
Latest Snapshot: September 26, 2025, 5:31 am
RSS URL: https://qiita.com/tags/csharp/feed
Publisher: https://qiita.com
Description: QiitaでC#タグが付けられた新着記事
Catalog: //qiita83.rssing.com/catalog.php?indx=75726148

↧

iTextSharpでPDFの文字を置換する、のを超簡易版で（C#）

December 27, 2019, 6:55 pm

≫ Next: C# WinFormsのListViewで複数項目選択時に、最後の項目が選択された際に一度だけ処理を実行するテク

≪ Previous: Azure Cognitive ServicesのSpeech to Textで書き起こしをしてみよう

ネットで探しても、あるのか無いのか。作ってみました。
あくまで基本的には、という温かい目で見てください。
簡単そうでなかなか・・・
とりあえず、ASCIIコード、つまり半角英文字と数字・記号が利用できる程度のもので、且つ"ABC"を'AAA'に置換する、という程度のものです。
PDFは漢字を表示できる半角英数字で記述しています。しかも、SJIS・UTF8は指定によりPDF文書ごとに・・・となっているようです。

サーチそのものはCONTENTSの中に出現する文字列をbyte配列の状態で比較しています。
ただ、制御関係の半角英数字が混じっている長いbyte配列なので、制御系とマッチしてしまわないように5文字以上の長めの単語で使ってください。
ここから、制御の文字列ではない状態のケースのみで、マッチするか？という処理をする。というように改造していく感じだと思います。

/// <summary>指定のPDFに、指定の文字列があれば、指定のbyte（初期値は半角SP）で埋めます。</summary>staticprivateboolreplace_PDF_textCONTENTS_proc(stringin_in_filepath,stringin_out_filepath,stringin_moto_text,bytein_埋めるbyte,intin_replace_count=0){if(File.Exists(in_in_filepath)==false)returnfalse;byte[]tmp_sarch_bytes=System.Text.Encoding.UTF8.GetBytes(in_moto_text);PdfReaderreader=newPdfReader(in_in_filepath);for(inti番=1;i番<=reader.NumberOfPages;i番++){PdfDictionarydict=reader.GetPageN(i番);PdfObjectobject2=dict.GetDirectObject(PdfName.CONTENTS);if(object2isPRStream){PRStreamstream=(PRStream)object2;byte[]data=PdfReader.GetStreamBytes(stream);intmatch_count=0;for(inti=0;i<data.Length-tmp_sarch_bytes.Length;i++){bytetype_by=data[i];Func<bool>get_match=()=>{for(intp=0;p<tmp_sarch_bytes.Length;p++){if(data[i+p]!=tmp_sarch_bytes[p])returnfalse;}returntrue;};boolis_match=get_match();if(is_match==false)continue;//// 合致したケースmatch_count++;for(intp=0;p<tmp_sarch_bytes.Length;p++){data[i+p]=in_埋めるbyte;}if(in_replace_count!=0&&match_count==in_replace_count)// 置換の回数指定があれば、その回数の置換で終了します。break;}stream.SetData(data);}}try{PdfStamperstamper=newPdfStamper(reader,newFileStream(in_out_filepath,FileMode.Create));stamper.Close();reader.Close();}catch(Exceptionex){}finally{reader.Close();}returntrue;}

以下のは、異なる長さに置換できるのですが、置換後を""としたところ問題がありました。

WindowsのPDFビュワーでは問題なく表示できます。
ですが、PDFダイレクト対応プリンタ(Ricoh MPC5503)ではエラーで印刷できませんでした。
上の"ABC"を"AAA"にする、置き換え型では大丈夫でした。
文字列が無い、というのが厳密なPDF仕様ではアウトなのかもしれません・・・

staticprivateboolreplace_PDF_textCONTENTS_proc(stringin_in_filepath,stringin_out_filepath,stringin_moto_text,stringin_new_text){if(File.Exists(in_in_filepath)==false)returnfalse;byte[]new_bytes=System.Text.Encoding.UTF8.GetBytes(in_new_text);byte[]tmp_sarch_bytes=System.Text.Encoding.UTF8.GetBytes(in_moto_text);PdfReaderreader=newPdfReader(in_in_filepath);for(intpage番号=1;page番号<=reader.NumberOfPages;page番号++)// このpage番号は1オリジンです{PdfDictionarydict=reader.GetPageN(page番号);PdfObjectobject2=dict.GetDirectObject(PdfName.CONTENTS);if(object2isPRStream){PRStreamstream=(PRStream)object2;byte[]data=PdfReader.GetStreamBytes(stream);List<byte>new_data=newList<byte>();//// 制御の文字列（オペレータ）は以下に詳しく書かれています。// http://www.kobu.com/docs/pdf/pdfxhand.htmstringdebug_text_UTF8=System.Text.Encoding.UTF8.GetString(data);stringdebug_text_Unicode=System.Text.Encoding.Unicode.GetString(data);intmatch_count=0;for(inti=0;i<data.Length-tmp_sarch_bytes.Length;i++){bytetype_by=data[i];chartype_c=(char)type_by;Func<bool>get_match=()=>{for(intp=0;p<tmp_sarch_bytes.Length;p++){if(data[i+p]!=tmp_sarch_bytes[p])returnfalse;}returntrue;};boolis_match=get_match();if(is_match==false){new_data.Add(data[i]);continue;}//// 合致したケースmatch_count++;new_data.AddRange(new_bytes);i+=tmp_sarch_bytes.Length;}//byte[] set_data = ;stream.SetData(new_data.ToArray());}}try{PdfStamperstamper=newPdfStamper(reader,newFileStream(in_out_filepath,FileMode.Create));stamper.Close();reader.Close();}catch(Exceptionex){}reader.Close();returntrue;}

↧

Trending Articles

y156 Zina • Page 2 • NoNude Models Galleries (Collections) → AMF • All Models...

April 11, 2019, 9:38 am

BVE5用　京都市営地下鉄烏丸線　Ver1.00

March 13, 2016, 5:53 am

レアル・マドリードアンセム「Hala Madrid y Nada Más」カナ歌詞と和訳とPV（デシマイムノ）

August 23, 2016, 11:34 pm

Robocopy のエラー (戻り値) について

January 23, 2018, 11:28 pm

FF11骨細工スキル上げ〔0-110〕

May 20, 2015, 2:36 am

行け!! 鳴神学園オカルト研究部　レビュー

March 31, 2016, 10:16 pm

斉木楠雄のΨ難 18話「照橋さんの斉木家Ψ訪/お茶の子ΨΨ！わらしべ長者/変形！スーパーΨズ/Ψ教育のススメ/テンションΨ高潮！カラオケ会」

November 13, 2016, 9:19 am

Get-WindowsUpdateLog で WindowsUpdate.log の出力に失敗する場合

November 1, 2018, 10:58 pm

七代目相ノ川一家【稲川会】

September 25, 2017, 3:01 pm

人気占い師・Sakkoが占う！今日のアナタの運勢と、ラッキーカラーは・・・

October 16, 2019, 2:30 pm

田辺のコンビニ強盗事件で２３歳の男を再逮捕

December 8, 2015, 2:13 am

三越伊勢丹

March 28, 2016, 12:20 pm

山下紗稀子(立命館美人女子陸上)のWikiプロフ.腹筋がスゴイ動画は

April 13, 2019, 4:37 am

海外在住者から見た日本人の異常な労働環境

June 6, 2013, 2:00 am

第48回関東地区空手道選手権大会結果

November 27, 2024, 10:56 pm

大阪・泉南イオンで飛び降り自殺とみられる転落事件が発生：ネットで拡散された理由とは

July 15, 2016, 12:05 pm

2019年東日本学生秋季選手権・新人戦／男子フリースタイルB・表彰式

November 30, 2019, 7:01 am

[転載]宮崎県日向市暴力団で検索

January 2, 2016, 3:47 pm

【傍聴記録】戸田真由美

September 18, 2015, 6:18 pm

2015年1月23日号　札幌信用金庫（1月1日付）

January 29, 2015, 4:17 am

© 2025 //www.rssing.com