PDF转HTML_PDF转换SDK_PDF文档转换 -万兴PDF

功能说明

将PDF文档转换为HTML文档


bool ConvertToHtml(const wchar_t* pdf_path, const wchar_t* dest_dir) {
    PDF2Html pdf_to_html;
    auto open_result = pdf_to_html.Open(pdf_path);
    if (open_result == PDF2Html::kOpenSuccess) {
        return pdf_to_html.Save(dest_dir);
}
return false;
}

方法：PDF2Html::Open

方法说明：打开PDF文档
调用参数说明：

参数	类型	必须	说明
file_path	const char或 const wchar_t	是	PDF文档路径。
password	const unsigned char*	否	密码
password_length	size_t	否	密码长度

返回类型：

类型	说明
/** * @brief 打开结果 */ enum OpenResult { kOpenFailed, kOpenSuccess, kOpenNeedPassword = 4, };	打开是否成功。

类型

说明

/**

* @brief 打开结果

enum OpenResult {

kOpenFailed,

kOpenSuccess,

kOpenNeedPassword = 4,

};

打开是否成功。


PDF2Html pdf_to_html;
unsigned char pwd[100] = {  "123456" };
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf", pwd, 6u);
if (open_result != PDF2Html::kOpenSuccess) {
    switch (open_result) {
        case PDF2Html::kOpenFailed:
            std::cerr << "打开文档失败." << std::endl;
            break;
        case PDF2Html::kOpenNeedPassword:
            std::cerr << "文档需要密码." << std::endl;
        default:
            break;
    }
}

方法：PDF2Html::AddPageRange

方法说明：添加转换页面范围，默认转换全部页面
调用参数说明：

参数	类型	必须	说明
start	unsigned int	是	起始页面
end	unsigned int	是	结束页面
step	unsigned int	否	步进，默认值是1

返回类型：

类型	说明
Void


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
    pdf_to_html.AddPageRange(2u,5u);
}

方法：PDF2Html::SetRegion

方法说明：设置转换页面矩形区域
调用参数说明：

参数	类型	必须	说明
left	float	是	矩形区域左上角x轴坐标值
top	float	是	矩形区域左上角y轴坐标值
right	float	是	矩形区域右下角x轴坐标值
bottom	float	是	矩形区域右下角y轴坐标值

返回类型：

类型	说明
Void


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
    pdf_to_html.SetRegion(100,300,200,200);
}

方法：PDF2Html::GetIgnoreImage

方法说明：获取忽略页面中的图片，默认为否

返回类型：

类型	说明
Bool	是否忽略页面中的图片


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetIgnoreImage(true);
if (pdf_to_html.GetIgnoreImage()) {
    std::cout << "忽略图片." << std::endl;
}
}

方法：PDF2Html::GetImageOfEntirePage

方法说明：获取是否将每一页转换为一张图片，默认为否

返回类型：

类型	说明
bool	是否将每一页转换为一张图片


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetImageOfEntirePage(true);
if (pdf_to_html.GetImageOfEntirePage()) {
    std::cout << "整个页面转换为图片." << std::endl;
}
}

方法：PDF2Html::GetImageDpi

方法说明：获取文档中图片的DPI

返回类型：

类型	说明
float	DPI值


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
    std::cout <<“DPI:”<< pdf_to_html.GetImageDpi() << std::endl;
}

方法：PDF2Html::SetIgnoreImage

方法说明：设置忽略页面中的图片
调用参数说明：

参数	类型	必须	说明
ignore_image	bool	是	忽略页面中的图片

返回类型：

类型	说明
Void


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetIgnoreImage(true);
}

方法：PDF2Html::SetImageOfEntirePage

方法说明：设置是否将每一页转换为一张图片
调用参数说明：

参数	类型	必须	说明
image_of_entire_page	Bool	是	是否将每一页转换为一张图片

返回类型：

类型	说明
Void


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetImageOfEntirePage(true);
}

方法：PDF2Html::SetImageDpi

方法说明：设置转换后图片的DPI
调用参数说明：

参数	类型	必须	说明
dpi	float	是	图片的DPI

返回类型：

类型	说明
Void


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetImageDpi(90);
}

方法：PDF2Html::GetIgnoreLink

方法说明：获取是否忽略页面中的超链接

返回类型：

类型	说明
bool	是否忽略页面中的超链接


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetIgnoreLink(true);
if (pdf_to_html.GetIgnoreLink()) {
    std::cout << "忽略超链接." << std::endl;
}

方法：PDF2Html::SetIgnoreLink

方法说明：设置是否忽略页面中的超链接
调用参数说明：

参数	类型	必须	说明
ignore_link	bool	是	是否忽略页面中的超链接

返回类型：

类型	说明
Void


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetIgnoreLink(true);
}

方法：PDF2Html::GetZipOutput

方法说明：获取是否压缩输出文档

返回类型：

类型	说明
bool	是否压缩输出文档


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetZipOutput(true);
if (pdf_to_html.GetZipOutput()) {
    std::cout << "压缩输出文档." << std::endl;
}
}

方法：PDF2Html::SetZipOutput

方法说明：设置是否忽略页面中的超链接
调用参数说明：

参数	类型	必须	说明
zip_output	bool	是	是否压缩输出文档

返回类型：

类型	说明
Void


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetZipOutput(true);
}

方法：PDF2Html::Save

方法说明：保存转换的文档
调用参数说明：

参数	类型	必须	说明
dest_path	const char或 const wchar_t	是	目标文件路径
progress	Progress	否	保存进度通知对象，默认为空

参数

类型

必须

说明

dest_path

const char*或

const wchar_t*

是

目标文件路径

progress

Progress

否

保存进度通知对象，默认为空

返回类型：

类型	说明
Void


PDF2Html pdf_to_html;
auto open_result = pdf_to_html.Open(L"F:\\source\\test.pdf");
if (open_result == PDF2Html::kOpenSuccess) {
pdf_to_html.SetZipOutput(true);
pdf_to_html.Save(L"F:\\output\\test.zip");
}

万兴 PDF

万兴 PDF

桌面端

移动端

PDF开发工具

PDF转HTML

方法：PDF2Html::Open

方法：PDF2Html::AddPageRange

方法：PDF2Html::SetRegion

方法：PDF2Html::GetIgnoreImage

方法：PDF2Html::GetImageOfEntirePage

方法：PDF2Html::GetImageDpi

方法：PDF2Html::SetIgnoreImage

方法：PDF2Html::SetImageOfEntirePage

方法：PDF2Html::SetImageDpi

方法：PDF2Html::GetIgnoreLink

方法：PDF2Html::SetIgnoreLink

方法：PDF2Html::GetZipOutput

方法：PDF2Html::SetZipOutput

方法：PDF2Html::Save